1. 데이터는 그 형태에 따라 정성 데이터와 정량 데이터로 구분된다. 다음 중 정성 데이터에 속하는 것은?

ㄱ. 풍향

ㄴ. 습도

ㄷ. 기상특보

ㄹ. 1시간 강수량

 

2. 다음 중 암묵지와 형식지의 상호작용과 가장 관련이 없는 것은?

ㄱ. 공통화

ㄴ. 내면화

ㄷ. 연결화

ㄹ. 추상화

 

3. SQL은 다양한 집계함수를 제공하는데 다음 집계함수 중 어떠한 데이터의 타입에도 사용이 가능한 것은?

ㄱ. AVG

ㄴ. COUNT

ㄷ. SUM

ㄹ. STDDEV

 

4. 다음 중 개인정보 비식별화 기법을 설명한 것으로 가장 부적절한 것은?

ㄱ. 총계처리 - 데이터의 총합 값을 보임으로써 개별 데이터의 값을 보이지 않도록 함

ㄴ. 데이터 마스킹 - 개인 식별에 중요한 데이터 값을 삭제

ㄷ. 가명처리 - 개인 식별에 중요한 데이터를 식별할 수 없는 다른 값으로 변경

ㄹ. 범주화 - 데이터의 값을 범주의 값으로 변환하여 값을 감춤

 

5. 다음 중 데이터에 대한 설명으로 가장 적절하지 않는 것은 무엇인가?

ㄱ. 양질의 데이터를 확보하지 못하면 잘못된 분석 결과를 얻음

ㄴ. 창의적인 데이터 매시업(Mashup)은 기존에 풀기 어려웠던 문제 해결에 도움

ㄷ. 비정형 데이터는 데이터 내부에 메타 데이터를 갖고 있으며 일반적으로 파일 형태로 저장

ㄹ. 공공부문에서 개방하고 있는 대표적인 데이터는 교통 데이터, 물가 데이터, 의료 데이터이다.

 

6. 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장, 가공, 분석하는 과정은?

ㄱ. 연결화

ㄴ. 내면화

ㄷ. 표출화

ㄹ. 공통화

 

7. 다음 중 그 자체로는 의미가 중요하지 않은 객관적인 사실인 데이터를 가공, 처리하여 얻을 수 없는 것은?

ㄱ. 지혜

ㄴ. 정보

ㄷ. 기호

ㄹ. 지식

 

8. 다음 중 지식에 대한 예시로 가장 적절한 것은?

ㄱ. A사이트보다 B사이트가 다른 물건도 비싸게 팔 것이다.

ㄴ. B사이트보다 가격이 상대적으로 저렴한 A사이트에서 USB를 사야겠다.

ㄷ. A사이트는 10,000원에, B사이트는 15,000원에 USB를 팔고 있다.

ㄹ. B사이트의 USB 판매가격이 A사이트보다 더 비싸다.

 

9. 다음 중 글로벌 기업의 빅데이터 활용사례로 그 연결이 부적절한 것은?

ㄱ. 구글 - 실시간 자동 번역시스템을 통한 의사소통의 불편 해소

ㄴ. 라쿠텐 - 이용자의 콘텐츠 기호를 파악하여 새로운 영화를 추천해주는 Cinematch 시스템 운영

ㄷ. 월마트 - 소셜 미디어를 통해 고객 소비 패턴을 분석하는 월마트랩(Wallmart Labs) 운영

ㄹ. 자라 - 일일 판매량을 실시간 데이터 분석으로 상품 수요를 예측

 

10. 다음은 데이터베이스의 구성요소들을 설명한 것이다. 각 설명에 해당하는 구성요소를 가장 적절하게 나열한 것은?

(A) 데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터

(B) 데이터베이스 내의 데이터를 신속하게 정렬하고 탐색하게 해주는 구조

ㄱ. 메타데이터 - 인덱스

ㄴ. 데이터모델 - 트리거

ㄷ. 백업데이터 - 저장된 절차

ㄹ. 스키마구조 - 데이터 마트

 

11. 다음 중 데이터에 관한 구조화된 데이터로서 다른 데이터를 설명해 주는 데이터로 정의되는 것은?

ㄱ. 데이터모델

ㄴ. 메타데이터

ㄷ. 백업데이터

ㄹ. 데이터마트

 

12. 다음 중 주요 데이터 분석 기술에 대한 설명으로 가장 부적절한 것은?

ㄱ. OLAP - 다차원의 데이터를 대화식으로 분석하기 위한 기술

ㄴ. Business Intelligence - 데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구

ㄷ. Business Analytics - 의사결정을 위한 통계적이고 수학적인 분석에 초점을 둔 기법

ㄹ. Deep Learning - 대용량 데이터에서 의미있는 정보를 추출하여 의사결정에 활용하는 기술

 

13. 아래는 특정산업의 일차원적 분석 사례를 나열한 것이다. 다음 중 특정산업으로 적절한 것은?

[트레이딩, 공급, 수요예측]

ㄱ. 소매업

ㄴ. 에너지

ㄷ. 운송업

ㄹ. 금융서비스

 

14. 다음 중 기업내부 데이터베이스인 고객관계관리(CRM)에 대한 설명으로 적절한 것은 무엇인가?

ㄱ. 부품의 설계, 제조, 유통 등의 공정 포함

ㄴ. 외부 공급업체와의 정보시스템 통합으로 시간과 비용 최적화

ㄷ. 기업의 내부 고객들만을 대상으로 한 정보시스템

ㄹ. 단순한 정보의 수집에서 탈피, 분석 중심의 시스템 구축 지향

 

15. 아래는 데이터베이스를 기반으로 기업 내 구추고디는 주요 정보시스템 중 하나를 설명한 것이다. 보기에서 가장 적합한 것을 고르시오.

[기업 전체를 경영자원의 효과적 이용이라는 관점에서 통합적으로 관리하고 경영의 효율화를 기하기 위한 시스템]

ㄱ. ERP

ㄴ. CRM

ㄷ. SCM

ㄹ. KMS

 

16. 다음 중 사회기반 구조로서의 데이터베이스에 대한 설명으로 가장 부적절한 것은?

ㄱ. 물류, 무역, 조세 등 사회간접자본 차원에서 정보망을 통해 유통, 이용된 정보가 데이터베이스로 구축

ㄴ. 지리, 교통 부문에서 데이터베이스가 보다 고도화되어 데이터베이스를 구축

ㄷ. 인터넷의 보편화로 데이터베이스가 사회 전반의 인프라로 자리매김

ㄹ. 의료, 교육, 행정 부문에서는 데이터베이스 구축과 활용이 활성화되지 못함

 

17. 러셀 L. 애오프가 1989년에 이야기한 DIKW Hiearchy는 데이터가 어떻게 진화하는지를 단계적으로 설명하였다. 다음 DIKW 단계를 설명하는 것 중 다른 하나는 무엇인가?

ㄱ. 지난 1년 매출액의 50%는 8월에 집중되어 있다.

ㄴ. 지난 1년 매출은 1월에서 8월까지 증가하였고, 12월까지 다시 증가하였다.

ㄷ. 날씨가 따뜻해지고, 지점을 확장하여 올 8월 매출액은 3000만원으로 예상한다.

ㄹ. 8월 A상품 구매 고객의 80%가 40대 여성 고객으로 대부분 회사원이다.

 

18. 다음 중 빅데이터에 대한 정의를 설명한 것으로 가장 부적절한 것은?

ㄱ. 대규모 데이터에서 저비용으로 가치를 추출, 초고속으로 수집 및 분석하기 위한 아키텍처이다.

ㄴ. 용량은 방대하지만 구조가 단순한 데이터세트의 집합이다.

ㄷ. 일반적인 데이터베이스 소프트웨어로 저장, 분석할 수 있는 범위를 초과하는 규모를 빅데이터라 정의한다.

ㄹ. 데이터의 양, 수집, 처리 속도가 급격히 증가하면서 나타난 현상이다.

 

19. 빅데이터 활용에 필요한 기본적인 3요소로 가장 적절한 것은?

ㄱ. 데이터, 기술, 인력

ㄴ. 데이터, 기술, 프로세스

ㄷ. 기술, 인력, 프로세스

ㄹ. 데이터, 인력, 프로세스

 

20. 다음 중 빅데이터 출현 배경에 관한 설명으로 부적절한 것은?

ㄱ. 개별 기업의 데이터 축적 및 데이터 활용에 대한 니즈 증가

ㄴ. 데이터 저장 기술의 발전과 저장 비용 감소

ㄷ. 인터넷, SNS와 사물네트워크의 확산으로 데이터 생산량 증가

ㄹ. 수집 관리 및 분석에 용이한 형태로 데이터 구조의 정형화

 

21. 다음 중 빅데이터의 수집, 구축, 분석의 최종 목적으로 가장 적절한 것은?

ㄱ. 새로운 통찰과 가치를 창출

ㄴ. 데이터 중심 조직 구성

ㄷ. 초고속 데이터 처리 기술 개발

ㄹ. 데이터 관리 비용 절감

 

22. 빅데이터의 기능 중 '공동 활용의 목적으로 구축된 유, 무형의 구조물 역할을 수행한다.' 라는 것에 해당하는 내용은 무엇인가?

ㄱ. 산업혁명 시대의 석탄, 철

ㄴ. 21세기의 원유

ㄷ. 렌즈

ㄹ. 플랫폼

 

23. 다음 중 빅데이터가 만들어 내는 변화로 가장 부적절한 것은?

ㄱ. 사전처리에서 사후처리 시대로의 변화

ㄴ. 대면조사에서 표본조사로의 변화

ㄷ. 데이터의 질보다 양의 중요도 증가

ㄹ. 인과관계에서 상관관계의 중요도 증가

 

24. 빅데이터가 만들어내는 본질적인 변화에 대한 설명이 부적절한 것은 무엇인가?

ㄱ. 질 -> 양

ㄴ. 인과관계 -> 상관관계

ㄷ. 사전처리 -> 사후처리

ㄹ. 표본조사 -> 인과관계

 

25. 다음 중 데이터의 가치 측정이 어려운 이유로 적절하지 않은 것은 무엇인가?

ㄱ. 데이터 재사용의 일반화로 특정 데이터를 언제 누가 사용했는지 알기 힘들기 때문이다.

ㄴ. 빅데이터 전문 인력의 증가로 다양한 곳에서 빅데이터가 활용되고 있기 때문이다.

ㄷ. 분석기술의 발전으로 과거에 분석이 불가능했던 데이터를 분석할 수 있게 되었기 때문이다.

ㄹ. 빅데이터는 기존에 존재하지 않던 새로운 가치를 창출하기 때문이다.

 

26. 다음 중 사생활 침해를 막기 위해 개인정보를 무작위 처리하는 등 데이터가 본래 목적 외에 가공되고 처리되는 것을 방지하는 기술은 무엇인가?

ㄱ. 정규화

ㄴ. 난수화

ㄷ. 익명화

ㄹ. 일반화

 

27. 다음 중 감성 분석(Sentimental Analysis)에 대한 설명으로 가장 부적절한 것은?

ㄱ. 특정 주제에 대한 사용자의 긍정/부정 의견을 분석한다.

ㄴ. 주로 온라인 쇼핑몰에서 사용자의 상품평에 대한 분석이 대표적 사례이다.

ㄷ. 사용자간의 소셜 관계를 알아내고자 할 때 이용한다.

ㄹ. 사용자가 사용한 문장이나 단어가 분석 대상이 된다.

 

28. 아래와 같은 비즈니스 문제가 있다면, 각 문제를 해결하기 위해 주로 사용되는 기법과 연결이 적절하지 않은 것은?

ㄱ. 맥주를 사는 사람은 콜라도 같이 구매하는 경우가 많다. - 연관규칙학습

ㄴ. 고객의 만족도가 충성도에 어떤 영향을 미치는가? - 회귀분석

ㄷ. 친분관계가 승진에 어떤 영향을 미치는가? - 소셜 네트워크 분석

ㄹ. 택배차량을 어떻게 배치하는 것이 비용측면에서 가장 효율적인가? - 유형분석

 

29. 아래 빅데이터 활용을 위한 기본 테크닉 중 어떤 사례에 해당하는가?

[A마트는 금요일 저녁에 맥주를 사는 사람은 기저귀도 함께 구매했다는 사실을 발견하고, 두가지 상품을 가까운 곳에 진열하기로 결정했다.]

ㄱ. 회귀분석

ㄴ. 연관성분석

ㄷ. 유형분석

ㄹ. 구문분석

 

30. 다음 핀테크 분야에서 빅데이터 활용이 가장 핵심적인 분야인 것은?

ㄱ. 크라우드 펀딩(Crowd Funding)

ㄴ. 신용평가(Credit Rating)

ㄷ. 간편결제(Simple Payment)

ㄹ. 블록체인(Block Chain)

 

31. 다음 중 딥러닝(Deep Learning)과 가장 관련 없는 분석 기법은?

ㄱ. LSTM

ㄴ. Autoencoder

ㄷ. K-NN

ㄹ. RNN

 

32. 최근에 딥러닝에 대한 관심이 전 세계적으로 높아지고 있다. 딥러닝을 활용하기 위해 다양한 오픈소스가 개발되어 제공되고 있다. 다음 중 이와 가장 관련이 없는 것은?

ㄱ. Caffe

ㄴ. Tensorflow

ㄷ. Anaconda

ㄹ. Theano

 

33. 다음 중 빅데이터 시대에 발생할 수 있는 위기 요인으로 가장 부적절한 것은?

ㄱ. 재산권 침해

ㄴ. 데이터 오용

ㄷ. 책임원칙 훼손

ㄹ. 사생활 침해

 

34. 다음 중 빅데이터 시대 위기 요인 중 사생활 침해 문제를 해결하기 위해 개인 정보를 사용하는 자가 적극적인 보호 장치를 강구하게 하는 방법으로 가장 적절한 것은?

ㄱ. 알고리즘에 대한 접근을 허용해 부당함을 반증할 방법을 명시해 공개할 것을 주문

ㄴ. 개인정보 제공자가 허락하는 동의제의 도입

ㄷ. 개인정보를 사용하는 사람이 직접 책임지는 책임제의 도입

ㄹ. 정보 사용자에게 수집된 내용을 공개하고 접근하는 권리 부여

 

35. 빅데이터 시대가 도래하면서 발생할 수 있는 부정적인 측면의 하나로 '책임 원칙의 훼손'을 들 수 있다. 다음 중 이에 대한 사례로 가장 적절한 것은?

ㄱ. 범죄 예측 프로그램에 의해 범행 전에 체포

ㄴ. 빅브라더가 출현하여 개인의 일상생활 전반을 감시

ㄷ. 여행 사실을 SNS에 올린 사람의 집에 강도가 침입

ㄹ. 검색엔진의 차별적인 누락에 의한 매출액 감소

 

36. 다음 중 데이터화(datafication) 현상에 큰 영향을 미치는 기술로 적절한 것은?

ㄱ. 사물인터넷

ㄴ. 인공지능

ㄷ. 가상현실

ㄹ. 3D 프린팅

 

37. 다음 중 사용자 정의 데이터 및 멀티미디어 데이터 등 복잡한 데이터 구조를 표현, 관리할 수 있는 데이터베이스 관리 시스템은 무엇인가?

ㄱ. 관계형 DBMS

ㄴ. 객체지향 DBMS

ㄷ. 네트워크 DBMS

ㄹ. 계층형 DBMS

 

38. 데이터 사이언스는 데이터 처리와 관련된 IT 영역, 분석적 영역, 그리고 비즈니스 컨설팅 영역을 포괄하고 있다. 다음 중 세 개의 영역과 다른 영역에 속하는 하나는?

ㄱ. 데이터 시각화

ㄴ. 데이터 웨어하우징

ㄷ. 분산 컴퓨팅

ㄹ. 파이썬 프로그래밍

 

39. 데이터 사이언스에서 인문학적 사고는 반드시 필요한 요소이다. 다음 중 인문학 열풍을 가져오게 한 외부 환경 요소로 가장 부적절한 것은?

ㄱ. 디버전스 동역학이 작용하는 복잡한 세계화

ㄴ. 비즈니스 중심이 제품생산에서 체험 경제를 기초로 한 서비스로 이동

ㄷ. 경제의 논리가 생산에서 최근 패러다임인 시장 창조로 변화

ㄹ. 빅데이터 분석 기법의 이해와 분석 방법론 확대

 

40. 다음 중 데이터 사이언티스트의 필요 역량으로 가장 부적절한 것은?

ㄱ. 설득력있는 스토리텔링

ㄴ. 통찰력 있는 분석

ㄷ. 네트워크 최적화

ㄹ. 다분야 간 협력을 위한 커뮤니케이션

 

41. 데이터 사이언스에 대한 설명으로 가장 부적절한 것은?

ㄱ. 데이터 사이언스는 데이터로부터 의미있는 정보를 추출하는 학문이다.

ㄴ. 주로 분석의 정확성에 초점을 두고 진행한다.

ㄷ. 정형데이터 뿐만 아니라 다양한 데이터를 대상으로 한다.

ㄹ. 기존의 통계학과는 달리 총체적 접근법을 사용한다.

 

+ Recent posts