모델링에 들어가기 앞서 object 데이터에 대해 인코딩 처리를 해주어야 한다. 📌 인코딩info를 찍어보면 object값이 자치구명, 건물명, 건물용도가 있는데건물명은 브랜드아파트들을 구분하기 위해 살리고 싶었으나 데이터 결측치가 많은 관계로 drop 시켰다. (아쉬운 부분..) 인코딩 방법 중에 대표적으로 onehot, label 인코딩 방법이 있다.이 중 label 인코딩을 할 경우 해당 컬럼의 데이터가 순서나 랭크가 없음에도 불구하고 인코딩을 함으로써 데이터가 왜곡될 수 있다.(분류모델도 그런가 싶어 질문을 하니 결정트리 같은 경우에는 영향이 크게 안간다는 답변을 들을 수 있었다.)또, onehot 인코딩은 카테고리 종류가 많을 경우 컬럼이 과하게 많아질 수 있으므로 범주화하는 방법도 고려할 수..