분류 전체보기 182

[Pandas / 기초] 판다스 결측치 - isnull, notnull, isna, notna, fillna, dropna

📍 결측치 : 비어있는 데이터 ✅ 엑셀로 열기 : pd.read_excel('파일명.xlsx', index_col='column') In [1]: import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') # index 설정 df Out[1]: ✅ 결측치로 채우기 : df['column'] = np.nan In [2]: import numpy as np df['학교'] = np.nan # 학교 데이터 전체를 NaN으로 채움 df Out[2]: ✅ 결측치 찾기 : isnull(), isna() In [3]: df['SW특기'].isnull() Out[3]: 지원번호 1번 False 2번 False 3번 False 4번 True 5번 Tru..

Pandas 2024.01.10

[Pandas / 기초] 판다스 데이터선택 - 조건(and, &, or, |, str함수, startswith, contains, isin, where)

📍 데이터 선택(조건) ✅ 엑셀로 열기 : pd.read_excel('파일명.xlsx', index_col='column') In [1]: import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') # index 설정 df Out[1]: ✅ 조건에 해당하는 데이터선택 : df[filter] In [2]: df['키'] >= 185 # 학생들의 키가 185 이상인지 여부를 True/False Out[2]: 지원번호 1번 True 2번 False 3번 False 4번 True 5번 True 6번 True 7번 True 8번 True Name: 키, dtype: bool In [3]: filt = (df['키'] >= 185) df[filt]..

Pandas 2024.01.10

[Pandas / 기초] 판다스 데이터선택 - iloc

📍 데이터 선택(iloc) : 위치를 이용하여 원하는 row, col 선택 ✅ 엑셀로 열기 : pd.read_excel('파일명.xlsx', index_col='column') In [1]: import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') # index 설정 df Out[1]: ✅ iloc : df.iloc['row_idx', 'col_idx'] In [2]: df.iloc[0] # 0번째 행의 데이터 Out[2]: 이름 채치수 학교 북산고 키 197 국어 90 영어 85 수학 100 과학 95 사회 85 SW특기 Python Name: 1번, dtype: object In [3]: df.iloc[4, 2] # 4번째 행의 2..

Pandas 2024.01.10

[Pandas / 기초] 판다스 데이터선택 - loc

📍 데이터 선택(loc) : 이름을 이용하여 원하는 row, col 선택 ✅ 엑셀로 열기 : pd.read_excel('파일명.xlsx', index_col='column') In [1]: import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') # index 설정 df Out[1]: ✅ loc : df.loc['row', 'col'] In [2]: df.loc['1번'] # index 1번에 해당하는 전체 데이터 Out[2]: 이름 채치수 학교 북산고 키 197 국어 90 영어 85 수학 100 과학 95 사회 85 SW특기 Python Name: 1번, dtype: object In [4]: df.loc['1번', '국어'] # i..

Pandas 2024.01.10

[프로그래머스 Level 2] 게임 맵 최단거리(Python)

📝 Level 2. 게임 맵 최단거리 더보기 📌 문제 설명 ROR 게임은 두 팀으로 나누어서 진행하며, 상대 팀 진영을 먼저 파괴하면 이기는 게임입니다. 따라서, 각 팀은 상대 팀 진영에 최대한 빨리 도착하는 것이 유리합니다. 지금부터 당신은 한 팀의 팀원이 되어 게임을 진행하려고 합니다. 다음은 5 x 5 크기의 맵에, 당신의 캐릭터가 (행: 1, 열: 1) 위치에 있고, 상대 팀 진영은 (행: 5, 열: 5) 위치에 있는 경우의 예시입니다. 위 그림에서 검은색 부분은 벽으로 막혀있어 갈 수 없는 길이며, 흰색 부분은 갈 수 있는 길입니다. 캐릭터가 움직일 때는 동, 서, 남, 북 방향으로 한 칸씩 이동하며, 게임 맵을 벗어난 길은 갈 수 없습니다. 아래 예시는 캐릭터가 상대 팀 진영으로 가는 두 가지..

[Pandas / 기초] 판다스 데이터선택

📍 데이터 선택 ✅ 엑셀로 열기 : pd.read_excel('파일명.xlsx', index_col='column') In [1]: import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') # index 설정 df Out[1]: ✅ Column 선택(label) : df['column'] (대괄호 1번) 시리즈로 출력 In [2]: df['이름'] Out[2]: 지원번호 1번 채치수 2번 정대만 3번 송태섭 4번 서태웅 5번 강백호 6번 변덕규 7번 황태산 8번 윤대협 Name: 이름, dtype: object ✅ Column 선택(label) : df[[column_list]] (대괄호 2번) 데이터 프레임으로 출력 In [4]: d..

Pandas 2024.01.10

[Pandas / 기초] 판다스 통계함수 - min, max, median, nlargest, mean, var, std, sum, cumsum, cumprod, count, mode, quantile, unique, nunique, agg, corr

📍 통계함수 ✅ 엑셀로 열기 : pd.read_excel('파일명.xlsx', index_col='column') In [1]: import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') # index 설정 df Out[1]: ✅ min() : 행/열에 대한 최솟값 In [2]: df['키'].min() Out[2]: 168 ✅ max() : 행/열에 대한 최댓값 In [3]: df['키'].max() Out[3]: 202 ✅ median() : 오름차순으로 정렬했을 때 중앙값 짝수개의 데이터가 있을 때 가운데 2개 중앙 데이터의 평균값 In [4]: df['키'].median() Out[4]: 188.0 ✅ nlargest(n) : ..

Pandas 2024.01.10

[Pandas / 기초] 판다스 데이터확인 - describe, info, head, tail, values, index, columns, shape, astype, cat, to_numeric, cut, qcut

📍 DataFrame 데이터 확인 ✅ 엑셀로 열기 : pd.read_excel('파일명.xlsx', index_col='column') In [1]: import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') # index 설정 df Out[1]: ✅ describe() : 데이터에 대한 통계요약정보 제공 count : 결측치를 제외한 데이터 갯수 mean : 평균값 std : 표준편차 min : 최솟값 25% : 1사분위수 50% : 2사분위수(중앙값) 75% : 3사분위수 max : 최댓값 In [2]: df.describe() Out[2]: : df.describe(include='object') categorical column(..

Pandas 2024.01.10

[Pandas / 기초] 판다스 데이터입출력 - to_csv, to_excel, ExcelWriter, read_csv, read_excel

📍 저장 ✅ DataFrame 객체 생성 : pd.DataFrame({data, index=[index_list]}) In [1]: import pandas as pd data = { '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'], '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'], '키' : [197, 184, 168, 187, 188, 202, 188, 190], '국어' : [90, 40, 80, 40, 15, 80, 55, 100], '영어' : [85, 35, 75, 60, 20, 100, 65, 85], '수학' : [100, 50, 70, 70, 10, 95, ..

Pandas 2024.01.10

[Pandas / 기초] 판다스 Index - name, reset_index, set_index, sort_index, fancy indexing, boolean indexing

📍 Index : 데이터에 접근할 수 있는 주소 값 ✅ DataFrame 객체 생성 : pd.DataFrame({data}) In [1]: import pandas as pd data = { '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'], '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'], '키' : [197, 184, 168, 187, 188, 202, 188, 190], '국어' : [90, 40, 80, 40, 15, 80, 55, 100], '영어' : [85, 35, 75, 60, 20, 100, 65, 85], '수학' : [100, 50, 70, 70, 10, ..

Pandas 2024.01.09