일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- binary search
- 이진탐색 증명
- ChatGPT 설명
- Selection Sort
- BERT
- Proof Selection Sort
- chatGPT
- 선택정렬 증명
- Discrete Wavelet Transform
- 선택정렬
- Binary Search Proof
- haar matrix
- GPT-3
- 이진탐색
Archives
- Today
- Total
Just Do IT
08. Pandas 기초 - 데이터 선택(조건) 본문
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다.
https://www.youtube.com/watch?v=PjhlUzp_cU0
조건을 포함한 데이터 선택
DataFrame에서 키가 185이상인 사람의 정보만 알고 싶거나 성이 '송'인 사람의 정보만 알고싶을 때와 같이 특정한 조건을 포함하여 데이터를 선택할 때 필요한 방법이다.
1. Data 준비
import pandas as pd
df = pd.read_excel('score.xlsx', index_col = '지원번호')
df
- 출력 결과
2. DataFrame에 조건을 통해 데이터 검색하기
- 특정 Column에 조건을 넣으면 각 row에 대해 True False로 반환한다.
df['키'] >= 185 # 학생들의 키가 185 이상인지 여부를 True / False
- 출력 결과
지원번호
1번 True
2번 False
3번 False
4번 True
5번 True
6번 True
7번 True
8번 True
Name: 키, dtype: bool
- True/False로 반환된 Series를 DataFrame에 넣어 정보를 얻는다.
filt = (df['키'] >= 185)
df[filt]
- 출력 결과
- 변수 선언 없이 한번에도 가능하다.
df[df['키'] >= 185]
- 출력 결과
- loc를 통해 선택된 DataFrame의 특정 Column만 가져올수도 있다.
df.loc[df['키']>=185,['이름','수학','과학']]
- 출력 결과
- &(and) 와 |(or) 등의 조건도 이용할 수 있다.
df.loc[(df['키']>=185) & (df['학교'] == '북산고')] # 키 185 이상인 북산고 학생 데이터
- 출력 결과
'데이터사이언스-코딩 > Pandas' 카테고리의 다른 글
10. Pandas 기초 - 데이터 수정 (replace, drop) (0) | 2022.01.28 |
---|---|
09. Pandas 기초 - 결측치 처리 (fillna, dropna) (0) | 2022.01.28 |
07. Pandas 기초 - 데이터 선택(loc, iloc) (0) | 2022.01.28 |
06. Pandas 기초 - 데이터 선택 (0) | 2022.01.28 |
05. Pandas 기초 - 데이터 확인 (0) | 2022.01.27 |
Comments