일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- ChatGPT 설명
- BERT
- chatGPT
- 선택정렬 증명
- 선택정렬
- Binary Search Proof
- 이진탐색 증명
- binary search
- Proof Selection Sort
- GPT-3
- Discrete Wavelet Transform
- 이진탐색
- haar matrix
- Selection Sort
Archives
- Today
- Total
Just Do IT
10. Pandas 기초 - 데이터 수정 (replace, drop) 본문
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다.
https://www.youtube.com/watch?v=PjhlUzp_cU0
1. Data 준비
import pandas as pd
df = pd.read_excel('score.xlsx', index_col = '지원번호')
df
- 출력 결과
2. Column 수정
- replace함수로 수정
df['학교'].replace({'북산고':'상북고','능남고':'무슨고'}) # inplace필요
- 출력 결과
지원번호
1번 상북고
2번 상북고
3번 상북고
4번 상북고
5번 상북고
6번 무슨고
7번 무슨고
8번 무슨고
Name: 학교, dtype: object
- 특정 Column에 대입하여 수정
df['SW특기'] = df['SW특기'].str.lower()
- 출력 결과
3. Column 추가
존재하지 않는 Column을 생성하면 추가된다.
df['총합'] = df['국어'] + df['영어'] + df['수학'] + df['과학'] + df['사회']
df
- 출력 결과
4. Row / Column 삭제
drop 함수를 이용하여 삭제할 수 있다.
- columns 삭제
df.drop(columns=['총합'])
- 출력 결과
- row 삭제
df.drop(index = '4번')
- 출력 결과
5. Row 추가
loc를 통하여 row를 추가할 수 있다.
df.loc['9번'] = ['이정환', '해남고등학교', 184,90,90,90,90,90,'Kotlin',450]
df
- 출력 결과
6. Cell 수정
loc를 통해 특정 Cell을 얻은 후 수정하면 된다.
df.loc['5번',['학교','SW특기']] = ['능남고등학교','C']
df
- 출력 결과
7. Column 순서 변경
df에 기존 df의 Column을 재배열 하는 방식으로 변경할 수 있다.
- 기존 df의 Column 구하기
cols = list(df.columns) cols
- 출력 결과
['이름', '학교', '키', '국어', '영어', '수학', '과학', '사회', 'SW특기', '총합', '결과']
- 새로운 df에 기존 df의 Column을 재배열 한다.
df = df[[cols[-1]] + cols[0:-1]] # cols[-1]은 값 so list로 감싸줌 + cols 0 ~ 끝 전까지 = 리스트
df
- 출력 결과
'데이터사이언스-코딩 > Pandas' 카테고리의 다른 글
12. Pandas 기초 - 그룹화 (groupby) (0) | 2022.01.28 |
---|---|
11. Pandas 기초 - 함수 적용 (apply) (0) | 2022.01.28 |
09. Pandas 기초 - 결측치 처리 (fillna, dropna) (0) | 2022.01.28 |
08. Pandas 기초 - 데이터 선택(조건) (0) | 2022.01.28 |
07. Pandas 기초 - 데이터 선택(loc, iloc) (0) | 2022.01.28 |
Comments