Just Do IT

06. Pandas 기초 - 데이터 선택 본문

데이터사이언스-코딩/Pandas

06. Pandas 기초 - 데이터 선택

풀용 2022. 1. 28. 00:29

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다.
https://www.youtube.com/watch?v=PjhlUzp_cU0

Label, Index를 통한 Column 선택방법과 슬라이싱 방법을 정리했다.

1. Data 준비

import pandas as pd
df = pd.read_excel('score.xlsx', index_col = '지원번호')
df
  • 출력 결과

Label로 Column 선택

df['이름']
  • 출력 결과
지원번호
1번    채치수
2번    정대만
3번    송태섭
4번    서태웅
5번    강백호
6번    변덕규
7번    황태산
8번    윤대협
Name: 이름, dtype: object

Index로 Column 선택

df.columns
  • 출력 결과
Index(['이름', '학교', '키', '국어', '영어', '수학', '과학', '사회', 'SW특기'], dtype='object')

df.columns의 인덱싱으로 Column들에 접근할 수 있다.

df.columns[0]
  • 출력 결과
'이름'

한번에 접근할 수도 있다.

df[df.columns[0]]
  • 출력 결과
지원번호
1번    채치수
2번    정대만
3번    송태섭
4번    서태웅
5번    강백호
6번    변덕규
7번    황태산
8번    윤대협
Name: 이름, dtype: object

슬라이싱

df['영어'][0:5] # 0~4 까지 영어 점수 데이터 가져옴
  • 출력 결과
지원번호
1번    85
2번    35
3번    75
4번    60
5번    20
Name: 영어, dtype: int64
Comments