일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Selection Sort
- Proof Selection Sort
- 이진탐색 증명
- Discrete Wavelet Transform
- binary search
- chatGPT
- 선택정렬 증명
- GPT-3
- 이진탐색
- haar matrix
- Binary Search Proof
- ChatGPT 설명
- BERT
- 선택정렬
Archives
- Today
- Total
Just Do IT
12. Pandas 기초 - 그룹화 (groupby) 본문
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다.
https://www.youtube.com/watch?v=PjhlUzp_cU0
조건을 포함한 데이터 선택
DataFrame에서 키가 185이상인 사람의 정보만 알고 싶거나 성이 '송'인 사람의 정보만 알고싶을 때와 같이 특정한 조건을 포함하여 데이터를 선택할 때 필요한 방법이다.
1. Data 준비
import pandas as pd
df = pd.read_excel('score.xlsx', index_col = '지원번호')
df
- 출력 결과
2. 그룹화
groupby함수를 통해 해당 Column의 중복되는 값을 group으로 묶는다.
df.groupby('학교').get_group('북산고')
- 출력 결과
계산가능한 데이터들은 통계량을 볼 수 있다.
df.groupby('학교').mean()
- 출력 결과
df.groupby('학교').size()
- 출력 결과
학교
능남고 3
북산고 5
dtype: int64
groupby이후 특정 Column만의 통계량을 확인 할 수 있다.
df.groupby('학교')[['국어','영어','수학']].mean()
- 출력 결과
'데이터사이언스-코딩 > Pandas' 카테고리의 다른 글
11. Pandas 기초 - 함수 적용 (apply) (0) | 2022.01.28 |
---|---|
10. Pandas 기초 - 데이터 수정 (replace, drop) (0) | 2022.01.28 |
09. Pandas 기초 - 결측치 처리 (fillna, dropna) (0) | 2022.01.28 |
08. Pandas 기초 - 데이터 선택(조건) (0) | 2022.01.28 |
07. Pandas 기초 - 데이터 선택(loc, iloc) (0) | 2022.01.28 |
Comments