데이터수집 2

[Project] 서울 전세가 예측(데이터 수집 및 전처리)(2)

전세가의 영향을 줄 수 있는 feature들을 모았으니 본격적으로 전세가에 대한 전처리를 했다.그런데 전세 데이터를 수집하면서 생각보다 데이터가 충분하지 않아 고민이 생겼다.그래서 전월세전환율에 따라 보증금, 월세가 바뀌었던 것이 떠올라 월세 데이터도 함께 활용하기로 했다.(이사하면서 고생했던게 이렇게 빛을 보는구나..😇) 📌 전월세 전환율# 동별 전환율df_guchange['지역'] = df_guchange['지역'].str.split(' ').str[1]df_guchange.set_index('지역', inplace=True)df_guchange=df_guchange.iloc[13:38]df_guchange = df_guchange[['2023-04']]df_guchange.rename(colum..

[Project] 서울 전세가 예측(데이터 수집 및 전처리)(1)

세미프로젝트 주제를 전세가 예측으로 정하면서 어떤 데이터를 활용할지에 대해 먼저 고민했다.전세가에 영향을 주는 교육, 교통, 인프라 등이 자연스럽게 떠올랐고 얼마나 근처에 있는지 보다는 주변에 얼마나 많은지에 초점을 두기로 했다.또한 법정동별, 도로명별 중 전세가의 기준점도 필요했는데 우리 팀은 법정동별 평균 전세가를 예측하기로 하였다. 📌 스타벅스 크롤링# 스타벅스 크롤링# 크롬드라이버 실행driver = webdriver.Chrome()#크롬 드라이버에 url 주소 넣고 실행driver.get('https://www.starbucks.co.kr/store/store_map.do?disp=locale')# 페이지가 완전히 로딩되도록 3초동안 기다림time.sleep(3)# 스타벅스 서울 클릭starb..