파이썬 데이터 읽기 (pandas)

2021. 4. 28. 01:58 Python/Python 프로그래밍

들어가며

csv, tsv, text 파일을 읽어 판다스(pandas) dataframe으로 읽는 방법이다.
encoding 문제 해결
sep을 '\t', ','등 원하는 방법으로
data의 사이즈가 클 경우이는 split해서 데이터를 읽는다.
읽는 동시에 data에서 원하는 column, row만을 filtering 할 수 있다.

코드

import pandas

def get_df(cols, filename, sep='\t'):
    iter_csv = pd.read_csv('/home/jslee/' + filename,iterator=True, encoding='utf8', chunksize=1000, sep=sep, names=cols)
    # df = pd.concat([chunk[chunk['field'] > constant] for chunk in iter_csv])
    df = pd.concat([chunk for chunk in iter_csv])
    return df
    
get_df(['col1', 'col2', 'col3'], filename, sep='\t')
get_df(['col1', 'col2', 'col3'], filename, sep=',')

출처 : ourcstory.tistory.com/328?category=630693

저작자표시 비영리 변경금지

'Python > Python 프로그래밍' 카테고리의 다른 글

C를 Python으로 Wrapping하는 방법 (0)	2021.04.28
파이썬 HTML 파싱 하는 방법 (0)	2021.04.28
파이썬 스케일이 다른 그래프 (0)	2021.04.28
파이썬 디렉토리 생성 코드 (0)	2021.04.28
[Python] Flask Response Encoding 문제 (0)	2021.04.28
[Python] Flask logging 하는 방법 (0)	2021.04.28
[Python] Virtualenv 설치 및 dependencies 관리하기 (0)	2021.04.28
[Python] matpltlib import 에서 발생한 에러 (0)	2021.04.28

Trackback: Comment: 0

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

어제보다 성장한 오늘

어제보다 성장한 오늘

파이썬 데이터 읽기 (pandas)

들어가며

코드

'Python > Python 프로그래밍' 카테고리의 다른 글

티스토리툴바