본문 바로가기
데이터 분석/데이터 분석

빅데이터 분석기사 필기 합격수기 및 공부방법

by thomasito 2022. 6. 1.
반응형

그 어렵다는 턱걸이 합격을 해내다

 데이터분석기사는 최소 60점을 합격선으로 하는 '절대평가'이다. 그리고 이 시험에서 그 어렵다는 턱걸이 합격을 해내고야 말았다. 약간 쑥쓰럽기는 하지만 절대평가 시험에는 아주 모범적으로 합격했다. 

                          

왜 빅데이터 분석기사를 공부했을까?

 나는 작년에 빅데이터 분석준전문가 시험에 응시해서 필기는 합격했다. 하지만 이 시험은 이상하게도 R 프로그래밍을 기본으로 하고 있었다. 파이썬이 활용할 수 있는 라이브러리도 훨씬 많은데 R을 굳이 배워야 하나라는 생각이 많이 들었다. 비유하자면 대부분 회사에서 워드를 쓰고 있는데 갑자기 시험은 한글로 보는 그런 기분이었다. 그래서 R 에 투자하는 시간을 줄이고자 과감히 데이터 분석전문가는 접기로 했다.

 

 시험을 공부하면서 파이썬 데이터 분석능력을 기르기 위해 데이터 분석기사를 보기로 했다.

(그리고 R에 대한 내용을 묻는 데이터분석 준전문가와는 달리 빅데이터 분석기사는 파이썬에 대한 내용이 전혀없다.)

 

빅데이터 분석기사 출제과목

빅데이터 분석기사는 아래와 같이 4 과목으로 구분되어 있다.

 

1. 빅데이터 분석기획 : 빅데이터에 대한 개념적인 내용이다.

2. 빅데이터 탐색 : 데이터 전처리에 대한 내용과 고등학교 때 배운 확률분포와 통계적 추정 방법론을 다룬다.

3. 빅데이터 모델링  : 회귀, 분류, 군집, 딥러닝, 비정형 데이터 등 각종 분석기법을 배운다.

4. 빅데이터 결과해석 : 분석 모형 검증 및 개선 방법

  

https://www.dataq.or.kr/www/sub/a_07.do

 

데이터자격시험

대용량의 데이터 집합으로부터 유용한 정보를 찾고 결과를 예측하기 위해 목적에 따라 분석기술과 방법론을 기반으로 정형/비정형 대용량 데이터를 구축, 탐색, 분석하고 시각화를 수행하는 업

www.dataq.or.kr

 이 중에 가장 어려운 파트는 파트 3 빅데이터 모델링일 것이다. 왜냐하면 머신러닝 기법인 회귀, 분류, 군집, 딥러닝 등 어려운 개념들이 쏟아져 나오기 때문이다. 나머지 파트 2, 파트 4의 경우는 대학교 때 기초통계학을 잘 들어서 상관관계 분석, 회귀분석, 확률과 통계추정을 잘 이해하고 있다면 크게 어려운 부분은 아니다. 물론 시계열분석(AR, MA, ARIMA 모형)이나 다변량 분석에 대한 내용을 더 알고 있으면 좋다.

 

합격 전략 : 아는 것은 확실히 모르는 것은 개념만 본다

 우선 이 시험의 합격선이 60점이고 사지선다형이라는 점을 감안하면 이 시험은 엄청나게 깊이있는 이해를 바라는 시험은 아니다. 그렇기 때문에 중간 중간에 이해가 안 되더라도 아는 것은 확실히 보고, 모르는 것은 그래도 개념 정도는 보고 넘어가는 것이 좋다.

 

1. 파트 2의 통계학의 문제는 잡고 가야 한다. 확률 분포, 점추정, 구간 추정, 상관관계와 같은 기초적인 내용들은 이해하고 맞출 수 있어야 한다. 

2. 파트 3의 머신러닝 기법들은 가볍게 개념 이해만 하고 넘어가자. 통계 문제처럼 자세하게 출제되지는 않는다.

3. 파트 4도 가볍게 보되 분석 모형 평가 및 개선방법들은 이해하고 넘어가자.

4. 파트 1의 빅데이터 분석계획 부분은 너무 심각하게 보지 말자. 충분히 문제만 잘 읽어도 맞출 수 있다.

 

 그리고 무엇보다 기출문제를 풀어보면서 대충 문제가 어떤 부분들을 묻는지 감을 잡는 것이 중요하다. 시험은 시험이기 때문이다.

 

현실의 문제는 더더욱 복잡하다

 최근에 직장생활을 하면서 어떤 분야의 전문가가 되는 것도 중요한데, 내 분야에서 다른 분야를 접목할 수 있는 능력이 되게 중요하다는 것을 깨닫는 계기가 있었다. 자산 배분 업무를 맡던 직원은 초개인화 서비스를 접목하여 각 개인별로 자산 배분을 제공할 수 있는 서비스를 개발했다. 이렇게 본인이 베이스를 쌓은 업무에 데이터 분석기법을 접목시키는 것이 중요하다는 생각이 많이 들었다.

 

 결국은 빅데이터 분석기법도 현실의 문제를 해결하기 위한 것이다. 따라서 모델을 빌드업하고 검증하는 것도 중요하지만

무엇보다 현업에서 문제를 발견하고 이것을 데이터 분석 스킬을 이용해서 솔루션을 제공하는 것이, 데이터 분석 자체의 테크닉보다 더 중요하다고 생각한다.

 

이 시험이 데이터 분석 전문가가 되는 길잡이가 되도 좋지만, 본인의 분야에서 데이터 분석기법을 적용할 수 있는 방법을 돌아볼 수 있는 시험이 되면 좋겠다.

 

 얼른 실기도 잘 준비하여 후기를 올리고 싶다. ^^

반응형

댓글