Notice

Recent Posts

Recent Comments

Tags more

Archives

관리 메뉴

Just Do IT

12. Pandas 기초 - 그룹화 (groupby) 본문

데이터사이언스-코딩/Pandas

풀용 2022. 1. 28. 02:30

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다.
https://www.youtube.com/watch?v=PjhlUzp_cU0

DataFrame에서 키가 185이상인 사람의 정보만 알고 싶거나 성이 '송'인 사람의 정보만 알고싶을 때와 같이 특정한 조건을 포함하여 데이터를 선택할 때 필요한 방법이다.


import pandas as pd
df = pd.read_excel('score.xlsx', index_col = '지원번호')
df

groupby함수를 통해 해당 Column의 중복되는 값을 group으로 묶는다.


df.groupby('학교').get_group('북산고')

계산가능한 데이터들은 통계량을 볼 수 있다.


df.groupby('학교').mean()


df.groupby('학교').size()


학교
능남고    3
북산고    5
dtype: int64

groupby이후 특정 Column만의 통계량을 확인 할 수 있다.


df.groupby('학교')[['국어','영어','수학']].mean()

11. Pandas 기초 - 함수 적용 (apply) (0)	2022.01.28
10. Pandas 기초 - 데이터 수정 (replace, drop) (0)	2022.01.28
09. Pandas 기초 - 결측치 처리 (fillna, dropna) (0)	2022.01.28
08. Pandas 기초 - 데이터 선택(조건) (0)	2022.01.28
07. Pandas 기초 - 데이터 선택(loc, iloc) (0)	2022.01.28