데이터분석 2

[ADsP] 3과목 데이터 분석(2), (3)

📍 3과목 데이터분석(3) 📌 Q1. 데이터마트 : 특정사용자가 관심을 갖고 있는 데이터를 담은 비교적 작은 규모의 데이터웨어하우스 📌 Q2. reshape : 변수를 조합해 변수명을 만들고 다양한 요약변수와 파생변수를 쉽게 생성하여 데이터 마트를 구성할 수 있는 패키지 📌 Q3. 파생변수 : 매우 주관적인 변수일 수 있으므로 논리적 타당성을 갖춰야 한다. 📌 Q4. 휴면고객 : 평균거래주기를 3~4배 이상 초과하거나 다음 달에 거래가 없을 것으로 예상되는 고객 📌 Q5. cast(md, id_variable~time) : 각 ID와 Variable에 대해 Time의 Value를 확인 📌 Q6. 파생변수 : 특정한 의미를 갖는 작위적 정의에 의한 변수 사용자가 특정 조건을 만족하거나 특정함수에 의해 값을..

자격증/ADsP 2024.02.22

[ADsP] 3과목 데이터 분석(1)

📍 3과목 데이터 분석(1) 📌 Q1. 탐색적 자료분석(EDA) : 데이터의 특성을 파악하기 위해 변수의 분포 등을 시각화하여 분석하는 방식 📌 Q2. 데이터마이닝 : 통계적 모델링이 아니므로 지나치게 통계적 가설이나 유의성에 집착하지 말아야 한다. 분석데이터를 학습 및 테스트 데이터로 6:4, 7:3, 8:2로 상황에 맞게 실시 성능에 집착하면 주 목적인 실무적용에 반하여 시간을 낭비할 수 있으므로 훈련 및 테스트 성능에 큰 편차가 없고 예상 성능을 만족하면 중단 모델링 시 반드시 다양한 옵션을 줘서 모델링을 수행하여 최고의 성과 도출할 필요는 없다. 📌 Q3. 데이터마이닝 : 정확도, 리프트, 디텍트 레이트, 정밀도 시뮬레이션 : Throughput 📌 Q4. 탐색적 데이터분석 : 분석가능한 데이터인..

자격증/ADsP 2024.02.18