일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- Discrete Wavelet Transform
- 선택정렬
- ChatGPT 설명
- BERT
- Proof Selection Sort
- Binary Search Proof
- 선택정렬 증명
- Selection Sort
- 이진탐색 증명
- haar matrix
- 이진탐색
- binary search
- chatGPT
- GPT-3
Archives
- Today
- Total
Just Do IT
04. Pandas 기초 - 파일 저장 및 열기 (read_csv, read_excel) 본문
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다.
https://www.youtube.com/watch?v=PjhlUzp_cU0
1. Data 준비
import pandas as pd
data = {
'이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'],
'학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'],
'키' : [197, 184, 168, 187, 188, 202, 188, 190],
'국어' : [90, 40, 80, 40, 15, 80, 55, 100],
'영어' : [85, 35, 75, 60, 20, 100, 65, 85],
'수학' : [100, 50, 70, 70, 10, 95, 45, 90],
'과학' : [95, 55, 80, 75, 35, 85, 40, 95],
'사회' : [85, 25, 75, 80, 10, 80, 35, 95],
'SW특기' : ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#']
}
df = pd.DataFrame(data, index=['1번','2번','3번','4번','5번','6번','7번','8번']) # Index는 df의 갯수와 맞춰줘야함
df.index.name = '지원번호'
df
- 출력 결과
2. 저장하기
2-1. CSV 파일로 저장하기
데이터들이 ,(쉼표)로 구분되어 있는 파일을 말한다.
to_csv로 csv파일을 만들 수 있다.
한글의 경우 encoding을 설정해주지 않으면 csv파일이 깨진다. 따라서 encoding을 'utf-8-sig'로 설정 해주어야 한다.
index를 False로 할 경우 index 정보는 제외하고 csv파일을 저장한다.
df.to_csv('score.csv',encoding='utf-8-sig', index=False)
- 출력 결과
2-2. txt파일로 저장하기
csv파일과 마찬가지로 to_csv를 통해 텍스트 파일을 만들 수 있다. sep을 '\t'로 주어서 데이터들이 탭으로 띄어져 있는 텍스트 파일을 만들 수 있다.
df.to_csv('score.txt',sep='\t')
- 출력 결과
2-3. 엑셀 파일로 저장하기
to_excel을 이용하여 엑셀 파일로 만들 수 있다.
df.to_excel('score.xlsx')
- 출력 결과
3. 파일 열기
3-1. csv 파일 열기
read_csv를 통해 csv 파일을 DataFrame형태로 가져올 수 있다.
df = pd.read_csv('score.csv')
df
- 출력 결과
skiprows 파라미터를 통하여 지정된 갯수 만큼의 row를 건너 뛸 수 있다.
df = pd.read_csv('score.csv',skiprows=1)
df
- 출력 결과 ( 가장 첫째 줄인 (이름,학교,키,국어,영어,수학,과학,사회,SW특기) 를 건너뜀)
nrows함수를 통하여 지정된 갯수 만큼의 row만 가져 올 수도 있다.
df = pd.read_csv('score.csv', nrows=4)
df
- 출력 결과
skiprows와 nrows를 같이 이용할 수도 있다.
3-2. 텍스트 파일 열기
read_csv를 통해 txt파일음 DataFrame형태로 가져올 수 있다.
sep 파라미터를 통하여 텍스트 파일이 어떤 형태로 구분되어져 있는지 입력하여야 한다.
index_col 파라미터를 통하여 index로 사용할 column을 지정할 수 있다.
df = pd.read_csv('score.txt', sep='\t', index_col='지원번호')
df
- 출력 결과
3-3. 엑셀 파일 열기
read_excel을 통해 엑셀 파일을 DataFrame형태로 가져올 수 있다.
df = pd.read_excel('score.xlsx')
df
- 출력 결과
'데이터사이언스-코딩 > Pandas' 카테고리의 다른 글
06. Pandas 기초 - 데이터 선택 (0) | 2022.01.28 |
---|---|
05. Pandas 기초 - 데이터 확인 (0) | 2022.01.27 |
03. Pandas 기초 - Index ( set_index, reset_index) (0) | 2022.01.27 |
02. Pandas 기초 - DataFrame (0) | 2022.01.27 |
01. Pandas 기초 - Series (0) | 2022.01.27 |
Comments