Just Do IT

04. Pandas 기초 - 파일 저장 및 열기 (read_csv, read_excel) 본문

데이터사이언스-코딩/Pandas

04. Pandas 기초 - 파일 저장 및 열기 (read_csv, read_excel)

풀용 2022. 1. 27. 22:21

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다.
https://www.youtube.com/watch?v=PjhlUzp_cU0

1. Data 준비

import pandas as pd
data = {
    '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'],
    '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'],
    '키' : [197, 184, 168, 187, 188, 202, 188, 190],
    '국어' : [90, 40, 80, 40, 15, 80, 55, 100],
    '영어' : [85, 35, 75, 60, 20, 100, 65, 85],
    '수학' : [100, 50, 70, 70, 10, 95, 45, 90],
    '과학' : [95, 55, 80, 75, 35, 85, 40, 95],
    '사회' : [85, 25, 75, 80, 10, 80, 35, 95],
    'SW특기' : ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#']
}
df = pd.DataFrame(data, index=['1번','2번','3번','4번','5번','6번','7번','8번']) # Index는 df의 갯수와 맞춰줘야함
df.index.name = '지원번호'
df
  • 출력 결과

2. 저장하기

2-1. CSV 파일로 저장하기

데이터들이 ,(쉼표)로 구분되어 있는 파일을 말한다.
to_csv로 csv파일을 만들 수 있다.
한글의 경우 encoding을 설정해주지 않으면 csv파일이 깨진다. 따라서 encoding을 'utf-8-sig'로 설정 해주어야 한다.
index를 False로 할 경우 index 정보는 제외하고 csv파일을 저장한다.

df.to_csv('score.csv',encoding='utf-8-sig', index=False)
  • 출력 결과

2-2. txt파일로 저장하기

csv파일과 마찬가지로 to_csv를 통해 텍스트 파일을 만들 수 있다. sep을 '\t'로 주어서 데이터들이 탭으로 띄어져 있는 텍스트 파일을 만들 수 있다.

df.to_csv('score.txt',sep='\t')
  • 출력 결과

2-3. 엑셀 파일로 저장하기

to_excel을 이용하여 엑셀 파일로 만들 수 있다.

df.to_excel('score.xlsx')
  • 출력 결과

3. 파일 열기

3-1. csv 파일 열기

read_csv를 통해 csv 파일을 DataFrame형태로 가져올 수 있다.

df = pd.read_csv('score.csv')
df
  • 출력 결과

skiprows 파라미터를 통하여 지정된 갯수 만큼의 row를 건너 뛸 수 있다.

df = pd.read_csv('score.csv',skiprows=1)
df
  • 출력 결과 ( 가장 첫째 줄인 (이름,학교,키,국어,영어,수학,과학,사회,SW특기) 를 건너뜀)

nrows함수를 통하여 지정된 갯수 만큼의 row만 가져 올 수도 있다.

df = pd.read_csv('score.csv', nrows=4)
df
  • 출력 결과

skiprows와 nrows를 같이 이용할 수도 있다.

3-2. 텍스트 파일 열기

read_csv를 통해 txt파일음 DataFrame형태로 가져올 수 있다.
sep 파라미터를 통하여 텍스트 파일이 어떤 형태로 구분되어져 있는지 입력하여야 한다.
index_col 파라미터를 통하여 index로 사용할 column을 지정할 수 있다.

df = pd.read_csv('score.txt', sep='\t', index_col='지원번호')
df
  • 출력 결과

3-3. 엑셀 파일 열기

read_excel을 통해 엑셀 파일을 DataFrame형태로 가져올 수 있다.

df = pd.read_excel('score.xlsx')
df
  • 출력 결과
Comments