Notice

Recent Posts

Recent Comments

Tags more

Archives

관리 메뉴

Just Do IT

10. Pandas 기초 - 데이터 수정 (replace, drop) 본문

데이터사이언스-코딩/Pandas

풀용 2022. 1. 28. 02:15

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다.
https://www.youtube.com/watch?v=PjhlUzp_cU0

import pandas as pd
df = pd.read_excel('score.xlsx', index_col = '지원번호')
df

replace함수로 수정

df['학교'].replace({'북산고':'상북고','능남고':'무슨고'}) # inplace필요

지원번호
1번    상북고
2번    상북고
3번    상북고
4번    상북고
5번    상북고
6번    무슨고
7번    무슨고
8번    무슨고
Name: 학교, dtype: object

df['SW특기'] = df['SW특기'].str.lower()

존재하지 않는 Column을 생성하면 추가된다.

df['총합'] = df['국어'] + df['영어'] + df['수학'] + df['과학'] + df['사회']
df

drop 함수를 이용하여 삭제할 수 있다.

df.drop(columns=['총합'])

df.drop(index = '4번')

loc를 통하여 row를 추가할 수 있다.

df.loc['9번'] = ['이정환', '해남고등학교', 184,90,90,90,90,90,'Kotlin',450]
df

loc를 통해 특정 Cell을 얻은 후 수정하면 된다.

df.loc['5번',['학교','SW특기']] = ['능남고등학교','C']
df

df에 기존 df의 Column을 재배열 하는 방식으로 변경할 수 있다.

['이름', '학교', '키', '국어', '영어', '수학', '과학', '사회', 'SW특기', '총합', '결과']

df = df[[cols[-1]] + cols[0:-1]] # cols[-1]은 값 so list로 감싸줌 + cols 0 ~ 끝 전까지 = 리스트 
df

12. Pandas 기초 - 그룹화 (groupby) (0)	2022.01.28
11. Pandas 기초 - 함수 적용 (apply) (0)	2022.01.28
09. Pandas 기초 - 결측치 처리 (fillna, dropna) (0)	2022.01.28
08. Pandas 기초 - 데이터 선택(조건) (0)	2022.01.28
07. Pandas 기초 - 데이터 선택(loc, iloc) (0)	2022.01.28