자격증/ADsP

[ADsP] 38회 복원문제

씨주 2024. 2. 23. 22:53

📍 38회 복원문제

📌 Q1.

아래의 데이터 크기를 작은 것부터 큰 순소로 바르게 나열한 것은?

ㄴ. 페타바이트(petabyte) - ㄱ. 엑사바이트(exabyte) - ㄹ. 제타바이트(zettabyte) - ㄷ. 요타바이트(yottabyte)

 

📌 Q2.

데이터 사이언티스트가 갖춰야 할 역량 중 성격이 나머지와 다른 하나는?

빅데이터에 대한 이론적 지식

 

📌 Q3.

데이터베이스의 특징에 대한 설명으로 적절하지 않은 것은?

통합된 데이터로서 동일한 내용의 데이터가 중복되어 저장한다.

(통합된 데이터라면 동일 X, 중복 X)

 

📌 Q4.

빅데이터 활용에 필요한 기본적인 3요소에 대한 설명으로 가장 적절하지 않은 것은?

프로세스 - 이전과는 다른 기술의 도입과 발전으로 체계적인 업무 처리 프로세스가 필요하게 되었다.

(3요소 : 데이터, 인력, 기술)

 

📌 Q5.

아래에서 빅데이터가 만들어진 본질적인 변화에 대한 설명으로 가장 적절하지 않은 것은?

(나) 데이터의 폭발적인 증가와 그에 따른 처리비용 증가의 대안으로 전반적인 샘플링 분석 방법이 다양해지고 관련 기술이 발전되었다.

(라) 복잡한 상관관계 분석에 투입되는 많은 시간과 큰 비용을 줄이기 위해 인과관계 분석을 선호하게 되면서 관련 기술이 발전되었다.

(나. 표본조사 -> 전수조사로 바뀜, 라. 인과관계가 아닌 상관관계분석을 선호)

 

📌 Q6.

상용 데이터베이스로 가장 적절하지 않은 것은?

Tableau

(적절 : DB2, SQL Server, Oracle)

 

📌 Q7.

다음은 데이터베이스의 구성요소들을 설명한 것이다. 각 설명에 해당하는 구성요소를 가장 적절하게 나열한 것은?

(A) 데이터에 관한 구조화된 데이터로 다른 데이터를 설명해주는 데이터 - 메타데이터

(B) 데이터베이스 내의 데이터를 신속하게 정렬하고 탐색하게 해주는 구조 - 인덱스

 

📌 Q8.

빅데이터 시대의 위기요인으로 가장 적절하지 않은 것은?

익명화

(적절 : 사생활 침해, 책임 원칙 훼손, 데이터 오용)

 

📌 Q9.

비즈니스 모델 캔버스를 활용한 과제 발굴의 영역으로 가장 적절하지 않은 것은?

혁신

(적절 : 업무, 제품, 고객)

 

📌 Q10.

분석활용 시나리오에 대한 설명으로 가장 적절한 것은?

기존 프로세스와 개선 프로세스의 차이점을 상세하게 분석한다.

 

📌 Q11.

분석 성숙도에 대한 설명으로 가장 적절하지 않은 것은?

유사 업종, 경쟁사와의 비교 분석을 도입한다.

(기업내 비교분석)

 

📌 Q12.

데이터 분석 조직구조에 대한 설명으로 가장 적절하지 않은 것은?

분산구조는 분석 조직의 인력을 현업부서에 배치하여 분석업무를 수행함으로써 분석이 집중되지 못해 신속한 실무적용이 어렵다.

 

📌 Q13.

분석마스터 플랜 수립시 과제 우선순위 평가 기준에 대한 설명으로 가장 적절하지 않은 것은?

우선순위 선정 매트릭스에서 시급성과 난이도가 높은 과제의 우선순위가 가장 높다.

(시급성은 높고 난이도는 낮은 과제의 우선순위가 가장 높다.)

 

📌 Q14.

분석 수준 진단 결과의 사분면 분석에서 준비도와 성숙도가 모두 낮은 유형은?

준비형

 

📌 Q15.

분석 기획 시 고려해야 할 사항으로 가장 적절한 것은?

분석과제의 목표를 설정하고 데이터를 분석하여 의미있는 결과를 도출해야 한다.

 

📌 Q16.

마스터 플랜 수립에서 적용 범위 및 방식을 정할 때 고려해야 할 요소로 가장 적절하지 않은 것은?

실행 용이성

(적절 : 업무 내재화 적용 수준, 분석 데이터 적용 수준, 기술 적용 수준)

 

📌 Q17.

다음 중 추정에 대한 설명으로 부적절한 것은?

신뢰수준 95%의 의미는 모수의 참값이 신뢰구간 내에 존재할 확률이 95%라는 것이다.

 

📌 Q18.

Hitters 데이터프레임은 1986~1987 시즌 메이저리그 야구 선수 322명에 대한 데이터이다. 아래의 결과에 대한 설명으로 적절하지 않은 것은?

Salary의 분포는 왼쪽 꼬리가 긴 분포를 가질 것이다.

(평균이 중앙값보다 크기 때문에 오른쪽 꼬리가 긴 분포를 가진다.)

 

📌 Q19.

확실하게 증명하고 싶은 가설로 뚜렷한 증거가 있어야 채택할 수 있는 가설은?

대립가설

 

📌 Q20.

다음 중 아래 의사결정나무에서 B의 지니지수를 계산한 결과로 적절한 것은?

0.32

(1 - (good / 전체)2 - (bad / 전체)2)

 

📌 Q21.

모집단의 크기가 비교적 작을 때 주로 사용되며 한번 추출된 표본이 재추출될 수 있는 표본 추출방법은?

복원추출법

 

📌 Q22.

아래에서 설명하는 앙상블 모형은?

원 데이터 집합으로부터 크기가 같은 표본을 여러 번 단순 임의 복원추출하여 각 표본에 대해 분류기를 생성한 후 그 결과를 앙상블하는 방법

배깅

 

📌 Q23.

다음 중 확률 및 확률분포에 관한 설명으로 부적절한 것은?

두 사건 A, B가 독립일 때, 사건 B의 확률은 A가 일어났다는 가정 하에서의 B의 조건부확률과는 다르다.

(B의 조건부확률과 같다.)

 

📌 Q24.

백색잡음에 대한 설명으로 가장 적절한 것은?

특정 시계열 데이터의 모든 백색잡음에 대한 합은 0에 수렴한다.

(평균이 0이므로 수렴)

 

📌 Q25.

아래의 거래 내역에서 연관규칙 사과 -> 딸기에 대한 향산도는?

0.3 / (0.7 * 0.45)

(P(딸기 | 사과) / P(딸기) = P(딸기, 사과 교집합) / P(딸기) * P(사과)

 

📌 Q26.

아래의 거래 내역에서 연관규칙 A -> B의 신뢰도는?

50%

(P(A, B 교집합) / P(A))

 

📌 Q27.

전체 신경망 노드 중 무작위로 노드를 선정해 다수의 모형을 구성하여 학습하고 각 모형의 결과를 결합해 예측 및 분류하는 기법은?

드롭아웃기법, 아다부스팅기법

 

📌 Q28.

연관규칙의 장점으로 틀린 것은?

품목 수가 증가해도 분석에 필요한 계산이 늘어나지 않는다.

 

📌 Q29.

chickwts 데이터 프레임은 여섯가지 종류의 닭 사료 첨가물(feed)과 각 사료를 먹인 닭의 무게(weight)를 변수로 가진다. 아래의 결과에 대한 설명으로 적절하지 않은 것은?

이상값이 존재하지 않는다.

(box plot 확인해보면 점으로 표현되어있는 이상값 존재)

 

📌 Q30.

다음 중 나머지와 분석 방법이 다른 것은?

주성분분석

 

📌 Q31.

측정대상의 속성을 측정하여 정량화하는 척도에 대한 설명으로 틀린 것은?

등간척도는 사칙연산 모두 가능하다.

(비율척도는 사칙연산 가능)

 

📌 Q32.

분류모형을 평가하기 위해 사용되는 방법으로 가장 적절하지 않은 것은?

덴드로그램

(군집개수 파악할 때 사용)

 

📌 Q33.

다음 중 고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬화하여 지도의 형태로 형성화하는 클러스터링 방법으로 적절한 것은?

자기조직화지도(Self-Organizing Map)

(SOM)

 

📌 Q34.

아래는 Sales와 TV광고 예산 간의 관계를 나타내는 그래프이다. 그림에 대한 설명으로 적절하지 않은 것은?

TV 광고 예산이 증가함에 따라 Sales의 분산은 동일하다.

(분산 증가)

 

📌 Q35.

아래 회귀분석 결과에 대한 설명으로 맞는 것은?

Time이 1단위 증가하면 weight가 평균적으로 8.8030 증가한다.

 

📌 Q36.

아래에서 설명하는 통계분석의 방법은 무엇인가?

- 고차원의 데이터를 저차원의 데이터로 변환시키는 통계적 기법

- 원래의 변수들을 선형결합으로 새로운 변수들을 생성함

- 전체 변수의 사용 대신 도출되는 몇 개의 새로운 변수만의 사용으로 분석을 대신할 수 있음

주성분 분석

 

📌 Q37.

다음 중 스피어만 상관계수에 대한 설명으로 부적절한 것은?

비선형적인 상관관계는 나타내지 못한다.

 

📌 Q38.

아래 데이터는 두 종류의 수면 유도제(group)를 무작위로 선정된 20명의 환자를 대상으로 수명시간 증감(extra)를 측정한 자료이다. 아래 결과에 대한 설명으로 잘못된 것은?

수면유도제2가 수면유도제1보다 효과적이다.

(알 수 없다.)

 

📌 Q39.

데이터 분할에 대한 설명으로 가장 적절하지 않은 것은?

검정용 데이터는 모델의 성능 평가에 사용된다.

(시험용 데이터가 성능평가에 사용)

 

📌 Q40.

군집분석에 대한 설명으로 가장 적절하지 않은 것은?

집단 간 이질성과 집단 내 동질성이 모두 낮아지는 방법으로 군집을 만든다.

(둘 다 높아져야 한다.)

'자격증 > ADsP' 카테고리의 다른 글

[ADsP] 39회 복원문제  (0) 2024.02.23
[ADsP] 3과목 데이터 분석(2), (3)  (0) 2024.02.22
[ADsP] 3과목 데이터 분석(1)  (0) 2024.02.18
[ADsP] 2과목 데이터분석 기획  (0) 2024.02.17
[ADsP] 1과목 데이터 이해  (0) 2024.02.14