전체 글 186

[Pandas / 기초] 판다스 통계함수 - min, max, median, nlargest, mean, var, std, sum, cumsum, cumprod, count, mode, quantile, unique, nunique, agg, corr

📍 통계함수 ✅ 엑셀로 열기 : pd.read_excel('파일명.xlsx', index_col='column') In [1]: import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') # index 설정 df Out[1]: ✅ min() : 행/열에 대한 최솟값 In [2]: df['키'].min() Out[2]: 168 ✅ max() : 행/열에 대한 최댓값 In [3]: df['키'].max() Out[3]: 202 ✅ median() : 오름차순으로 정렬했을 때 중앙값 짝수개의 데이터가 있을 때 가운데 2개 중앙 데이터의 평균값 In [4]: df['키'].median() Out[4]: 188.0 ✅ nlargest(n) : ..

Pandas 2024.01.10

[Pandas / 기초] 판다스 데이터확인 - describe, info, head, tail, values, index, columns, shape, astype, cat, to_numeric, cut, qcut

📍 DataFrame 데이터 확인 ✅ 엑셀로 열기 : pd.read_excel('파일명.xlsx', index_col='column') In [1]: import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') # index 설정 df Out[1]: ✅ describe() : 데이터에 대한 통계요약정보 제공 count : 결측치를 제외한 데이터 갯수 mean : 평균값 std : 표준편차 min : 최솟값 25% : 1사분위수 50% : 2사분위수(중앙값) 75% : 3사분위수 max : 최댓값 In [2]: df.describe() Out[2]: : df.describe(include='object') categorical column(..

Pandas 2024.01.10

[Pandas / 기초] 판다스 데이터입출력 - to_csv, to_excel, ExcelWriter, read_csv, read_excel

📍 저장 ✅ DataFrame 객체 생성 : pd.DataFrame({data, index=[index_list]}) In [1]: import pandas as pd data = { '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'], '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'], '키' : [197, 184, 168, 187, 188, 202, 188, 190], '국어' : [90, 40, 80, 40, 15, 80, 55, 100], '영어' : [85, 35, 75, 60, 20, 100, 65, 85], '수학' : [100, 50, 70, 70, 10, 95, ..

Pandas 2024.01.10

[Pandas / 기초] 판다스 Index - name, reset_index, set_index, sort_index, fancy indexing, boolean indexing

📍 Index : 데이터에 접근할 수 있는 주소 값 ✅ DataFrame 객체 생성 : pd.DataFrame({data}) In [1]: import pandas as pd data = { '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'], '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'], '키' : [197, 184, 168, 187, 188, 202, 188, 190], '국어' : [90, 40, 80, 40, 15, 80, 55, 100], '영어' : [85, 35, 75, 60, 20, 100, 65, 85], '수학' : [100, 50, 70, 70, 10, ..

Pandas 2024.01.09

[Pandas / 기초] 판다스 자료구조 - Series, DataFrame

📍 Pandas : 파이썬에서 사용하는 데이터 분석 라이브러리 In [1]: import pandas as pd pd.__version__ Out[1]: '2.0.3' 📍 Series : 1차원 데이터(정수, 실수, 문자열 등) ✅ 차원 : Series.ndim In [2]: # Series는 1차원 자료구조이므로 1 출력 s = pd.Series([1, 2, 3, 4]) s.ndim Out[2]: 1 ✅ Series 객체 생성 : pd.Series([list], dtype) 예) 1월부터 4월까지 평균 온도 데이터(-20, -10, 10, 20) In [3]: temp = pd.Series([-20, -10, 10, 20]) print(temp) 0 -20 1 -10 2 10 3 20 dtype: in..

Pandas 2024.01.09

[프로그래머스 Level 2] 타겟넘버(Python)

📝 Level 2. 타겟넘버 더보기 📌 문제 설명 n개의 음이 아닌 정수들이 있습니다. 이 정수들을 순서를 바꾸지 않고 적절히 더하거나 빼서 타겟 넘버를 만들려고 합니다. 예를 들어 [1, 1, 1, 1, 1]로 숫자 3을 만들려면 다음 다섯 방법을 쓸 수 있습니다. -1+1+1+1+1 = 3 +1-1+1+1+1 = 3 +1+1-1+1+1 = 3 +1+1+1-1+1 = 3 +1+1+1+1-1 = 3 사용할 수 있는 숫자가 담긴 배열 numbers, 타겟 넘버 target이 매개변수로 주어질 때 숫자를 적절히 더하고 빼서 타겟 넘버를 만드는 방법의 수를 return 하도록 solution 함수를 작성해주세요. 📌 제한사항 주어지는 숫자의 개수는 2개 이상 20개 이하입니다. 각 숫자는 1 이상 50 이하인..