일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Discrete Wavelet Transform
- GPT-3
- binary search
- 이진탐색
- 이진탐색 증명
- Proof Selection Sort
- Selection Sort
- chatGPT
- haar matrix
- 선택정렬 증명
- Binary Search Proof
- 선택정렬
- ChatGPT 설명
- BERT
- Today
- Total
목록데이터사이언스-코딩/Pandas (12)
Just Do IT
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 조건을 포함한 데이터 선택 DataFrame에서 키가 185이상인 사람의 정보만 알고 싶거나 성이 '송'인 사람의 정보만 알고싶을 때와 같이 특정한 조건을 포함하여 데이터를 선택할 때 필요한 방법이다. 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 2. 그룹화 groupby함수를 통해 해당 Column의 중복되는 값을 group으로 묶는다. df.groupby('학교').get_group('북산고') 출력 결과 계산가능한 데이터들은 통계량을..
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 2. apply 함수 적용 apply함수를 이용해 DataFrame에 원하는 함수를 사용할 수 있다. 키 뒤에 cm 붙이기 # 키 뒤에 cm를 붙이는 역할 def add_cm(height): return str(height)+'cm' df['키'] = df['키'].apply(add_cm) df 출력 결과 SW특기 capitalize하기 df['키'] >= 185 # 학생들의 키가 185 이상인..
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 2. Column 수정 replace함수로 수정 df['학교'].replace({'북산고':'상북고','능남고':'무슨고'}) # inplace필요 출력 결과 지원번호 1번 상북고 2번 상북고 3번 상북고 4번 상북고 5번 상북고 6번 무슨고 7번 무슨고 8번 무슨고 Name: 학교, dtype: object 특정 Column에 대입하여 수정 df['SW특기'] = df['SW특기'].str.l..
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 결측치 처리가 필요한 이유 우리가 실제로 접하는 데이터에는 수많은 결측치들이 존재한다. 항상 완벽하게 정돈되고 채워진 데이터를 만날 수는 없다. 따라서 결측치를 잘 처리하는 것도 굉장히 중요하다. 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 2. 데이터 채우기 fillna() 함수로 모든 NaN 데이터를 채운다. df.fillna('없음') inplace = True로 해주지 않으면 실제 데이터는 변하지 않는다. df['SW특기'].fil..
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 조건을 포함한 데이터 선택 DataFrame에서 키가 185이상인 사람의 정보만 알고 싶거나 성이 '송'인 사람의 정보만 알고싶을 때와 같이 특정한 조건을 포함하여 데이터를 선택할 때 필요한 방법이다. 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 2. DataFrame에 조건을 통해 데이터 검색하기 특정 Column에 조건을 넣으면 각 row에 대해 True False로 반환한다. df['..
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 loc와 iloc loc DataFrame Column의 label로 접근하는 방법이다. iloc DataFrame Column의 index로 접근하는 방법이다. 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 loc df.loc[row label,col label]로 해당 데이터에 접근할 수 있다. row나 col의 label로 접근 할 수 있다. df.loc['1번'] 출력 결과 이름 채치수 학교..
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 Label, Index를 통한 Column 선택방법과 슬라이싱 방법을 정리했다. 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 Label로 Column 선택 df['이름'] 출력 결과 지원번호 1번 채치수 2번 정대만 3번 송태섭 4번 서태웅 5번 강백호 6번 변덕규 7번 황태산 8번 윤대협 Name: 이름, dtype: objectIndex로 Column 선택 df.columns 출력 결과 Ind..
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 1. Data 준비 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 출력 결과 2. Data 확인 describe() 계산 가능한* 데이터에 대해 Column 별로 데이터의 갯수, 평균, 표준편차, 최소/최대값 등의 정보를 보여준다. df.describe() 출력 결과 info() Column명, Non-Null 데이터의 갯수, 데이터 타입등을 보여준다. df.info() 출력 결과 Index: 8 entries, 1번 to 8번 Data columns (total 9 c..
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 1. Data 준비 import pandas as pd data = { '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'], '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'], '키' : [197, 184, 168, 187, 188, 202, 188, 190], '국어' : [90, 40, 80, 40, 15, 80, 55, 100], '영어' : [85, 35, 75, 60, 20, 100, 65, 85], '수학' : [100, ..
본 포스팅은 유튜브 나도코딩님의 판다스 강의를 정리하여 만들었습니다. https://www.youtube.com/watch?v=PjhlUzp_cU0 1. Data 준비 import pandas as pd data = { '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'], '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'], '키' : [197, 184, 168, 187, 188, 202, 188, 190], '국어' : [90, 40, 80, 40, 15, 80, 55, 100], '영어' : [85, 35, 75, 60, 20, 100, 65, 85], '수학' : [100, ..