Just Do IT

10. Pandas 기초 - 데이터 수정 (replace, drop) 본문

데이터사이언스-코딩/Pandas

10. Pandas 기초 - 데이터 수정 (replace, drop)

풀용 2022. 1. 28. 02:15

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다.
https://www.youtube.com/watch?v=PjhlUzp_cU0

1. Data 준비

import pandas as pd
df = pd.read_excel('score.xlsx', index_col = '지원번호')
df
  • 출력 결과

2. Column 수정

  1. replace함수로 수정
    df['학교'].replace({'북산고':'상북고','능남고':'무슨고'}) # inplace필요
  • 출력 결과
지원번호
1번    상북고
2번    상북고
3번    상북고
4번    상북고
5번    상북고
6번    무슨고
7번    무슨고
8번    무슨고
Name: 학교, dtype: object
  1. 특정 Column에 대입하여 수정
df['SW특기'] = df['SW특기'].str.lower()
  • 출력 결과

3. Column 추가

존재하지 않는 Column을 생성하면 추가된다.

df['총합'] = df['국어'] + df['영어'] + df['수학'] + df['과학'] + df['사회']
df
  • 출력 결과

4. Row / Column 삭제

drop 함수를 이용하여 삭제할 수 있다.

  1. columns 삭제
df.drop(columns=['총합'])
  • 출력 결과
  1. row 삭제
df.drop(index = '4번')
  • 출력 결과

5. Row 추가

loc를 통하여 row를 추가할 수 있다.

df.loc['9번'] = ['이정환', '해남고등학교', 184,90,90,90,90,90,'Kotlin',450]
df
  • 출력 결과

6. Cell 수정

loc를 통해 특정 Cell을 얻은 후 수정하면 된다.

df.loc['5번',['학교','SW특기']] = ['능남고등학교','C']
df
  • 출력 결과

7. Column 순서 변경

df에 기존 df의 Column을 재배열 하는 방식으로 변경할 수 있다.

  1. 기존 df의 Column 구하기
    cols = list(df.columns)
    cols
  • 출력 결과
['이름', '학교', '키', '국어', '영어', '수학', '과학', '사회', 'SW특기', '총합', '결과']
  1. 새로운 df에 기존 df의 Column을 재배열 한다.
df = df[[cols[-1]] + cols[0:-1]] # cols[-1]은 값 so list로 감싸줌 + cols 0 ~ 끝 전까지 = 리스트 
df
  • 출력 결과
Comments