[Python] Pandas csv를 dataframe으로 읽고 쓰는 방법

2021. 4. 28. 02:10 Python/Python 프로그래밍

Python에서 DataFrame을 임시 데이터를 저장하는 방법

pandas를 사용하면서, 중간 데이터를 저장하거나 최종 데이터를 저장을 해야할 때가 있다.
이때 csv로 저장하고, 불러오는 방법을 설명한다.

 

DataFrame을 CSV파일로 저장하기

DataFrame을 CSV로 저장하는 방법은 매우 간단하다.
dataframe의 object에서 to_csv의 메소드를 이용하면 된다.

datafram.to_csv('result.csv')

 

CSV파일 DataFrame으로 불러오기

csv의 파일을 DataFrame으로 불러오기 위해서는 아래와 같이 실행하면 된다.
이때, 데이터의 크기가 너무 커서 어떤 조건을 만족하는 데이터만을 불러오고 싶으면
iterator=True를 통해서 iteration을 돌려서 가져오면 기존 데이터를 전체 불러오지 않고,
일부를 가져올 수 있다.

def get_df(cols, filename, sep='\t'):
    # filename = 'filename'
    iter_csv = pd.read_csv(filename,iterator=True, chunksize=1000, sep=sep, names=cols)
    # df = pd.concat([chunk[chunk['field'] > constant] for chunk in iter_csv])
    df = pd.concat([chunk for chunk in iter_csv])
    return df

 

출처 : ourcstory.tistory.com/431?category=630693