Just Do IT

12. Pandas 기초 - 그룹화 (groupby) 본문

데이터사이언스-코딩/Pandas

12. Pandas 기초 - 그룹화 (groupby)

풀용 2022. 1. 28. 02:30

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다.
https://www.youtube.com/watch?v=PjhlUzp_cU0

조건을 포함한 데이터 선택

DataFrame에서 키가 185이상인 사람의 정보만 알고 싶거나 성이 '송'인 사람의 정보만 알고싶을 때와 같이 특정한 조건을 포함하여 데이터를 선택할 때 필요한 방법이다.

1. Data 준비

import pandas as pd
df = pd.read_excel('score.xlsx', index_col = '지원번호')
df
  • 출력 결과

2. 그룹화

groupby함수를 통해 해당 Column의 중복되는 값을 group으로 묶는다.

df.groupby('학교').get_group('북산고')
  • 출력 결과

계산가능한 데이터들은 통계량을 볼 수 있다.

df.groupby('학교').mean()
  • 출력 결과
df.groupby('학교').size()
  • 출력 결과
학교
능남고    3
북산고    5
dtype: int64

groupby이후 특정 Column만의 통계량을 확인 할 수 있다.

df.groupby('학교')[['국어','영어','수학']].mean()
  • 출력 결과
Comments