Pandas

[Pandas / 기초] 판다스 그룹화 - groupby, pivot_table

씨주 2024. 1. 10. 22:07

📍 그룹화

: 동일한 값을 가진 것들끼리 합쳐서 통계 또는 평균 등의 값을 계산하기 위해 사용

 

✅ 엑셀로 열기

: pd.read_excel('파일명.xlsx', index_col='column')

 

✅ 그룹화 후 그룹별 행 갯수

: df.groupby('column').size()

 

✅ 그룹화 후 평균값

: df.groupby('column').mean()

In [6]:
# 계산 가능한 데이터의 평균값
df.groupby('학교').mean(numeric_only=True)
 
Out[6]:

 

df.groupby('column')[column_list].mean()

 

df.groupby([column_list]).mean()

 

df.groupby('column').mean().sort_values('column')

✅ 그룹화 후 갯수

: df.groupby('column').count()

 

✅ 그룹화 후 데이터갯수

: df.groupby('column').value_counts(normalize=True/False)

 

✅ 피벗테이블

: df.pivot_table(index, columns, values)

 

 

 

참고 : 나도코딩 파이썬 코딩 무료 강의 (활용편5) - 데이터 분석 및 시각화, 이 영상 하나로 끝내세요

(https://youtu.be/PjhlUzp_cU0?si=LW_MjXLjZVY9PrUt)