📍 1과목 데이터 이해
📌 Q1.
정형데이터 : 수치, 도형, 기호 등
(풍향, 습도, 1시간 강수량 등)
정성데이터 : 언어, 문자 등
(기상특보 등)
📌 Q2.
암묵지와 형식지의 상호작용 관계
공통화 - 표출화 - 연결화 - 내면화
📌 Q3.
COUNT : 데이터타입 상관없이 사용 가능
📌 Q4.
데이터마스킹 : 같은 속성을 유지한 채, 새롭고 읽기 쉬운 데이터를 익명으로 생성하는 기술
(개인 정보 식별이 가능한 특정 데이터 값 삭제 처리 X)
📌 Q5.
비정형데이터 : 데이터 내부에 메타 데이터를 가짐
(파일 형태로 저장 X)
반정형데이터 : 파일 형태로 저장
📌 Q6.
표출화 : 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장, 가공, 분석하는 과정
📌 Q7.
그 자체로는 의미가 중요하지 않은 객관적인 사실인 데이터를 가공 및 처리하여 얻을 수 있는 것 : 정보, 지혜, 지식, (기호 X)
📌 Q8.
지식 예시 : B사이트보다 가격이 상대적으로 저렴한 A사이트에서 USB를 사야겠다.
📌 Q9.
글로벌 기업의 빅데이터 활용사례
구글 : 실시간 자동 번역시스템을 통한 의사소통의 불편 해소
넷플릭스 : 이용자의 콘텐츠 기호를 파악하여 새로운 영화를 추천해주는 Cinematch 시스템 운영
월마트 : 소셜 미디어를 통해 고객 소비 패턴을 분석하는 월마트랩 운영
자라 : 일일 판매량을 실시간 데이터 분석으로 상품 수요를 예측
📌 Q10.
A 메타데이터 : 데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해주는 데이터
B 인덱스 : 데이터베이스 내의 데이터를 신속하게 정렬하고 탐색하게 해주는 구조
📌 Q11.
데이터웨어하우스 특성
일괄된 형식으로 정의
시간의 흐름에 따라 변화하는 값을 저장
특정 주제에 따라 데이터들이 분류, 저장, 관리
데이터베이스 : 데이터의 지속적 갱신에 따른 무결성 유지
📌 Q12.
OLAP : 다차원의 데이터를 대화식으로 분석
Business Intelligence : 데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구
Business Analytics : 의사결정을 위한 통계적이고 수학적인 분석에 초점
Data Mining : 대용량 데이터에서 의미있는 정보를 추출하여 의사결정에 활용
📌 Q13.
에너지 : 트레이딩, 공급, 수요예측
📌 Q14.
고객관계관리(CRM) : 단순한 정보의 수집에서 탈피, 분석 중심의 시스템 구축 지향
공급망관리(SCM=Supply Chain Management) : 외부 공급업체와 통합된 시스템으로 연계하여 시간과 비용을 최적화
📌 Q15.
ERP(Enterprise Resource Planning) :
기업 전체를 경영자원의 효과적 이용이라는 관점에서 통합적으로 관리하고 경영의 효율화를 기하기 위한 시스템
📌 Q16.
의료, 교육, 행정부문에서 사회기반 구조로서의 데이터베이스 구축과 활용이 활성화되어 있다.
📌 Q17.
지식 예시 : 날씨가 따뜻해지고 지점을 확장하여 올 8월 매출액은 3000만원으로 예상한다.
📌 Q18.
빅데이터 : 기존의 작은 데이터 처리 분석으로는 얻을 수 없었던 통찰과 가치를 창출하는 일
데이터의 양, 다양성, 수집과 처리속도가 급격히 증가하면서 나타난 현상
하둡 : 빅데이터 플랫폼 환경 구축(빅데이터의 기반이 되는 것 X)
📌 Q19.
빅데이터 기본 3요소 : 데이터, 기술, 인력
📌 Q20.
빅데이터 출현 배경 :
통신 기술의 발전, 분산처리 기술의 발전, SNS의 급격한 확산
(공공데이터의 개방 가속화 X)
📌 Q21.
빅데이터의 수집, 구축, 분석의 최종 목적 :
새로운 통찰과 가치 창출
📌 Q22.
플랫폼 : 공동 활용의 목적으로 구축된 유무형의 구조물 역할을 수행한다.
📌 Q23.
빅데이터가 만들어내는 변화 :
가치가 있을 것으로 예상되는 특정 정보만 수집하는 것이 아닌 가능한 많은 데이터를 모으고 그 데이터를 다양한 방식으로 조합해 숨은 정보를 찾아내는 방식이 중요
사소한 몇 개의 오류데이터는 분석결과에 영향을 미치지 않기 떄문에 데이터세트에 포함하여도 무방
인과관계의 규명없이 상관관계 분석 결과만으로 인사이트를 얻는다.
(수많은 데이터 중에서 분석에 필요한 데이터를 선정하기 위해 표본조사 기법의 중요성이 대두되고 있다. X)
📌 Q24.
플랫폼형 비즈니스 모델 :
상품, 서비스, 기술 등의 기반 위에 다른 이해관계자들이 보완적인 상품, 서비스, 기술을 제공하는 생태계 구축을 목표로 한다.
📌 Q25.
데이터의 가치측정이 어려운 이유 :
데이터의 재사용, 분석기술 발전, 새로운 가치 창출
(빅데이터 전문인력 증가 X)
📌 Q26.
난수화 : 개인정보를 무작위 처리하는 등 데이터가 본래 목적 외에 가공되고 처리되는 것을 방지하는 기술
📌 Q27.
감성분석 :
사용자의 긍정, 부정 의견 분석
사용자의 상품평에 대한 분석이 대표적 예시
사용자가 사용한 문장이나 단어가 분석 대상
소셜 네트워크분석 :
사용자간의 소셜 관계를 알아내고자 할 때 이용
📌 Q28.
연관규칙학습 : 맥주를 사는 사람은 콜라도 같이 구매하는 경우
소셜네트워크분석 : 친분관계가 승진에 미치는 영향
회귀분석 : 고객의 만족도가 충성도에 미치는 영향
유형분석 : 사용자가 어떤 특성을 가진 집단에 속하는지 알아볼 때
📌 Q29.
연관성분석 : 맥주를 사는 사람은 기저귀도 함께 구매했다는 사실을 발견하고 두 상품을 가까운 곳에 진열한다.
📌 Q30.
신용평가 : 핀테크 분야에서 빅데이터 활용이 가장 핵심적인 분야
📌 Q31.
딥러닝 : CNN, LSTM, Autoencorder
분류분석 : SVM
📌 Q32.
딥러닝 : Caffe, Tensorflow, Theano
머신러닝 : Anaconda
📌 Q33.
빅데이터 시대에 발생할 수 있는 위기요인 :
데이터 오용, 책임원칙 훼손, 사생활 침해
(재산권 침해 X)
📌 Q34.
사생활 침해 문제 해결방안 : 정보 사용자 책임제로 변환
📌 Q35.
빅데이터 시대의 위기와 통제 :
데이터 익명화 : 사생활 침해에 대한 근본요인을 차단할 수 있어 빠른 기술발전 필요
일어난 일에 대한 데이터에 의존하므로 예측의 정확도는 높지만 항상 맞을 수는 없어 데이터 오용의 피해가 발생
빅데이터가 발생시키는 문제를 중간자 입장에서 중재하며 해결해주는 알고리즈미스트도 새로운 직업으로 부상
개인정보 사용자의 정보사용에 대한 무한책임의 한계로 개인정보 사용 동의제보다 책임제를 강화시켜야 한다.
민주주의 국가의 형사 처벌과 같이 잠재적 위협이 아닌 명확하게 행동한 결과에 대해 책임을 묻기 때문에 빅데이터 사전 성향 분석을 실시한다면 책임원칙 훼손
📌 Q36.
데이터화 현상에 큰 영향을 미치는 기술 : 사물인터넷(IoT)
📌 Q37.
객체지향 DBMS : 사용자 정의 데이터 및 멀티미디어 데이터 등 복잡한 데이터 구조를 표현, 관리할 수 있는 데이터베이스 관리 시스템
📌 Q38.
비즈니스컨설팅영역 : 데이터시각화
IT영역 : 데이터웨어하우징, 분산컴퓨팅, 파이썬프로그래밍
📌 Q39.
인문학 열풍을 가져오게 한 외부환경 요소 :
컨버전스에서 디버전스로의 변화
생산에서 서비스로의 변화
생산에서 시장창조로의 변화
(빅데이터 분석 기법의 이해와 분석 방법론 확대 X)
📌 Q40.
데이터 사이언티스트들의 필요역량 :
통찰력있는 분석, 설득력있는 스토리텔링, 다분야간 커뮤니케이션
(뉴럴네트워크 최적화 X)
📌 Q41.
데이터 사이언스 :
데이터로부터 의미있는 정보 추출
정형데이터 뿐만 아니라 다양한 데이터를 대상
기존의 통계학과 달리 총체적 접근법 사용
통찰력있는 분석에 초점을 두고 진행(분석의 정확성 X)
📌 Q42.
데이터베이스 설계 절차 :
요구사항 분석 - 개념적 설계 - 논리적 설계 - 물리적 설계
📌 Q43.
데이터 크기 :
페타바이트 - 엑사바이트 - 제타바이트 - 요타바이트
📌 Q44.
통찰력을 제공하는 분석기술 : 모델링, 예측, 최적화
정보를 제공하는 분석기술 : 추출
📌 Q45.
미래사회의 특성과 빅데이터 역할 :
융합 - 창조력
리스크 - 대응력
불확실성 - 통찰력
스마트(단순화 X) - 경쟁력
📌 Q46.
비정형데이터 : 사용후기, 검색어, 음성파일
반정형데이터 : 센서데이터
📌 Q47.
프로세스오류 :
결정에서 분석과 통찰력을 고려하지 않는 것
대안을 진지하게 고려하지 않은 것
데이터수집이나 분석이 늦어 사용할 수 없게 되는 것
로직오류 :
부정확한 가정을 하고 테스트를 하지 않는 것
📌 Q48.
SQL
DML : UPDATE, SELECT, INSERT, DELETE
DDL : CREATE
📌 Q49.
소셜네트워크분석 : 핀테크기업에서 대출 제공할 떄 활용
기계학습 : 대규모 데이터를 처리분석할 때 상당한 분석 인프라와 많은 시간이 소요될 수 있다.
한국어의 경우 언어적 특성으로 인해 감정분석에 상대적으로 어려운 측면
분류, 예측모형(연관규칙학습 X) : 개인 신용도 평가에 많이 활용
📌 Q50.
데이터사이언스 : 정형, 반정형, 비정형 데이터 모두를 대상으로 분석
'자격증 > ADsP' 카테고리의 다른 글
[ADsP] 38회 복원문제 (1) | 2024.02.23 |
---|---|
[ADsP] 39회 복원문제 (0) | 2024.02.23 |
[ADsP] 3과목 데이터 분석(2), (3) (0) | 2024.02.22 |
[ADsP] 3과목 데이터 분석(1) (0) | 2024.02.18 |
[ADsP] 2과목 데이터분석 기획 (0) | 2024.02.17 |