Just Do IT

08. Pandas 기초 - 데이터 선택(조건) 본문

데이터사이언스-코딩/Pandas

08. Pandas 기초 - 데이터 선택(조건)

풀용 2022. 1. 28. 01:23

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다.
https://www.youtube.com/watch?v=PjhlUzp_cU0

조건을 포함한 데이터 선택

DataFrame에서 키가 185이상인 사람의 정보만 알고 싶거나 성이 '송'인 사람의 정보만 알고싶을 때와 같이 특정한 조건을 포함하여 데이터를 선택할 때 필요한 방법이다.

1. Data 준비

import pandas as pd
df = pd.read_excel('score.xlsx', index_col = '지원번호')
df
  • 출력 결과

2. DataFrame에 조건을 통해 데이터 검색하기

  1. 특정 Column에 조건을 넣으면 각 row에 대해 True False로 반환한다.
df['키'] >= 185 # 학생들의 키가 185 이상인지 여부를 True / False
  • 출력 결과
  지원번호
1번     True
2번    False
3번    False
4번     True
5번     True
6번     True
7번     True
8번     True
Name: 키, dtype: bool
  1. True/False로 반환된 Series를 DataFrame에 넣어 정보를 얻는다.
filt = (df['키'] >= 185)
df[filt]
  • 출력 결과
  1. 변수 선언 없이 한번에도 가능하다.
df[df['키'] >= 185]
  • 출력 결과
  1. loc를 통해 선택된 DataFrame의 특정 Column만 가져올수도 있다.
df.loc[df['키']>=185,['이름','수학','과학']]
  • 출력 결과
  1. &(and) 와 |(or) 등의 조건도 이용할 수 있다.
df.loc[(df['키']>=185) & (df['학교'] == '북산고')] # 키 185 이상인 북산고 학생 데이터
  • 출력 결과
Comments