'데이터사이언스-코딩' 카테고리의 글 목록

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 조건을 포함한 데이터 선택 DataFrame에서 키가 185이상인 사람의 정보만 알고 싶거나 성이 '송'인 사람의 정보만 알고싶을 때와 같이 특정한 조건을 포함하여 데이터를 선택할 때 필요한 방법이다. 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 2. 그룹화 groupby함수를 통해 해당 Column의 중복되는 값을 group으로 묶는다. df.groupby('학교').get_group('북산고') 출력 결과 계산가능한 데이터들은 통계량을..

데이터사이언스-코딩/Pandas 2022. 1. 28. 02:30

11. Pandas 기초 - 함수 적용 (apply)

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 2. apply 함수 적용 apply함수를 이용해 DataFrame에 원하는 함수를 사용할 수 있다. 키 뒤에 cm 붙이기 # 키 뒤에 cm를 붙이는 역할 def add_cm(height): return str(height)+'cm' df['키'] = df['키'].apply(add_cm) df 출력 결과 SW특기 capitalize하기 df['키'] >= 185 # 학생들의 키가 185 이상인..

데이터사이언스-코딩/Pandas 2022. 1. 28. 02:19

10. Pandas 기초 - 데이터 수정 (replace, drop)

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 2. Column 수정 replace함수로 수정 df['학교'].replace({'북산고':'상북고','능남고':'무슨고'}) # inplace필요 출력 결과 지원번호 1번 상북고 2번 상북고 3번 상북고 4번 상북고 5번 상북고 6번 무슨고 7번 무슨고 8번 무슨고 Name: 학교, dtype: object 특정 Column에 대입하여 수정 df['SW특기'] = df['SW특기'].str.l..

데이터사이언스-코딩/Pandas 2022. 1. 28. 02:15

09. Pandas 기초 - 결측치 처리 (fillna, dropna)

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 결측치 처리가 필요한 이유 우리가 실제로 접하는 데이터에는 수많은 결측치들이 존재한다. 항상 완벽하게 정돈되고 채워진 데이터를 만날 수는 없다. 따라서 결측치를 잘 처리하는 것도 굉장히 중요하다. 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 2. 데이터 채우기 fillna() 함수로 모든 NaN 데이터를 채운다. df.fillna('없음') inplace = True로 해주지 않으면 실제 데이터는 변하지 않는다. df['SW특기'].fil..

데이터사이언스-코딩/Pandas 2022. 1. 28. 01:50

08. Pandas 기초 - 데이터 선택(조건)

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 조건을 포함한 데이터 선택 DataFrame에서 키가 185이상인 사람의 정보만 알고 싶거나 성이 '송'인 사람의 정보만 알고싶을 때와 같이 특정한 조건을 포함하여 데이터를 선택할 때 필요한 방법이다. 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 2. DataFrame에 조건을 통해 데이터 검색하기 특정 Column에 조건을 넣으면 각 row에 대해 True False로 반환한다. df['..

데이터사이언스-코딩/Pandas 2022. 1. 28. 01:23

07. Pandas 기초 - 데이터 선택(loc, iloc)

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 loc와 iloc loc DataFrame Column의 label로 접근하는 방법이다. iloc DataFrame Column의 index로 접근하는 방법이다. 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 loc df.loc[row label,col label]로 해당 데이터에 접근할 수 있다. row나 col의 label로 접근 할 수 있다. df.loc['1번'] 출력 결과 이름 채치수 학교..

데이터사이언스-코딩/Pandas 2022. 1. 28. 00:49

06. Pandas 기초 - 데이터 선택

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 Label, Index를 통한 Column 선택방법과 슬라이싱 방법을 정리했다. 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 Label로 Column 선택 df['이름'] 출력 결과 지원번호 1번 채치수 2번 정대만 3번 송태섭 4번 서태웅 5번 강백호 6번 변덕규 7번 황태산 8번 윤대협 Name: 이름, dtype: objectIndex로 Column 선택 df.columns 출력 결과 Ind..

데이터사이언스-코딩/Pandas 2022. 1. 28. 00:29

05. Pandas 기초 - 데이터 확인

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 2. Data 확인 describe() 계산 가능한* 데이터에 대해 Column 별로 데이터의 갯수, 평균, 표준편차, 최소/최대값 등의 정보를 보여준다. df.describe() 출력 결과 info() Column명, Non-Null 데이터의 갯수, 데이터 타입등을 보여준다. df.info() 출력 결과 Index: 8 entries, 1번 to 8번 Data columns (total 9 c..

데이터사이언스-코딩/Pandas 2022. 1. 27. 23:59

04. Pandas 기초 - 파일 저장 및 열기 (read_csv, read_excel)

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 1. Data 준비 import pandas as pd data = { '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'], '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'], '키' : [197, 184, 168, 187, 188, 202, 188, 190], '국어' : [90, 40, 80, 40, 15, 80, 55, 100], '영어' : [85, 35, 75, 60, 20, 100, 65, 85], '수학' : [100, ..

데이터사이언스-코딩/Pandas 2022. 1. 27. 22:21

03. Pandas 기초 - Index ( set_index, reset_index)

본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 1. Data 준비 import pandas as pd data = { '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'], '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'], '키' : [197, 184, 168, 187, 188, 202, 188, 190], '국어' : [90, 40, 80, 40, 15, 80, 55, 100], '영어' : [85, 35, 75, 60, 20, 100, 65, 85], '수학' : [100, ..

데이터사이언스-코딩/Pandas 2022. 1. 27. 21:54

Just Do IT

목록데이터사이언스-코딩 (12)

Just Do IT

티스토리툴바