Just Do IT

03. Pandas 기초 - Index ( set_index, reset_index) 본문

데이터사이언스-코딩/Pandas

03. Pandas 기초 - Index ( set_index, reset_index)

풀용 2022. 1. 27. 21:54

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다.
https://www.youtube.com/watch?v=PjhlUzp_cU0

1. Data 준비

import pandas as pd
data = {
    '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'],
    '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'],
    '키' : [197, 184, 168, 187, 188, 202, 188, 190],
    '국어' : [90, 40, 80, 40, 15, 80, 55, 100],
    '영어' : [85, 35, 75, 60, 20, 100, 65, 85],
    '수학' : [100, 50, 70, 70, 10, 95, 45, 90],
    '과학' : [95, 55, 80, 75, 35, 85, 40, 95],
    '사회' : [85, 25, 75, 80, 10, 80, 35, 95],
    'SW특기' : ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#']
}
df = pd.DataFrame(data, index=['1번','2번','3번','4번','5번','6번','7번','8번']) # Index는 df의 갯수와 맞춰줘야함
df
  • 출력 결과

index를 통해 DataFrame의 index를 볼 수 있다.

df.index
  • 출력 결과
  • Index(['1번', '2번', '3번', '4번', '5번', '6번', '7번', '8번'], dtype='object')

2. Index 이름 설정

index.name을 통해 index의 이름을 column처럼 지어 줄 수 있다.

df.index.name = '지원번호'
df
  • 출력 결과

2-1. Index 초기화

reset_index를 통해 설정 했던 index 이름을 원래대로 초기화 시킬 수 있다. 이 때 설정 했던 index명과 index는 DataFrame의 새로운 column과 value로 들어가게 된다.

df.reset_index()
  • 출력 결과

drop 파라미터를 통해 사용하던 index명과 index들을 삭제 할 수 있다.
reset_index는 실제 데이터에는 아무런 영향을 끼치지 않는다. 따라서 inplace 파라미터를 통하여 실제 데이터에 반영 할 수 있다.

df.reset_index(drop=True, inplace = True)
  • 출력 결과

3. Index 설정

지정한 column으로 index를 설정 할 수 있다.
inplace를 이용해야 실제 데이터에 반영 할 수 있다.

df.set_index('이름') 
  • 출력 결과

4. Index 정렬

sort_index()를 통해 index를 정렬 할 수 있다.

df.sort_index()
  • 출력 결과( 가나다 순으로 정렬 )

ascending 파라미터를 통해 내림차순으로 정렬 할 수도 있다.

df.sort_index()
  • 출력 결과 ( 가나다 역순으로 정렬 )
Comments