본문 바로가기
자격증

10회 빅데이터 분석기사 실기 후기(+돈 안 들이고 12일만에 따기)

by wldusdn 2025. 7. 4.

안녕하시렵니까 이번 포스팅은 제 10회 빅데이터 분석기사 실기 후기 12일 간의 공부 방법 한번 남겨보려고 합니다.

 

빅분기 필기를 1년 전에 따놨어서 머릿속에서 이론이 사라진 채로 준비하려니 참 막막했는데요..ㅎㅎ 결국 미루고미루다 2주도 채 남지 않았을 때 시작해버렸습니다..

 

제가 공부한 스케줄을 정리해봤는데요! 시작할 때부터 12일치 계획을 세우진 않았고 그냥 하루하루 하다보니 이런 스케줄로 진행이 됐더라구요

1~2일차 3일차 4일차 5일차 6일차 7일차
- 데이터마님 100제 풀이 및 복습 - 1유형 체험 환경
- 데이터 코드랩
30제 풀이
- 데이터마님 & 데이터코드랩 복습

- 2유형 회귀모델
- 2유형 체험환경
- 2유형 분류모델
- 1 & 2유형 복습
- 3유형 데이터코드랩 이론공부
8일차 9일차 10일차 11일차 12일차 시험 당일
- 2, 3회 기출
- 3유형 체험환경
- 4, 5회 기출
- 체험환경 복습
- 3유형 데이터서핑 앤 노트 이론 - 3유형 응용문제
- 1유형 복습
- 6, 7회 기출
- 8, 9회 기출
- 홍쌤 예상문제 풀이
🖥️

 

근데 이대로 하려면 하루 평균 7시간은 투자해야해서 더 널널하게 잡는 걸 추천드립니다,,

 

일단 이번 공부는 짧은 시간동안 돈 한푼💰 안들이고 따는 게 목표였기 때문에 여러 강의와 자료를 봤는데, 이걸 유형별로 정리해두면 빅분기 실기 준비하시는 분들께 도움이 되지 않을까 싶어서 끄적여 봅니다.


작업환경 세팅

  • Jupyter notebook(주피터 노트북) : 단계적으로 코드 실행이 가능한 파이선 개발 환경, 별도 설치 필요
  • Google colab(구글 코랩) : 클라우드 기반 주피터 노트북 환경, 별도 설치 없이 웹 브라우저로 사용가능

저는 집에서 공부할 땐 주피터 노트북을 썼고, 밖에서 할 땐 구글 코랩을 썼습니다.

둘다 똑같으니 뭘 쓰든 상관은 없지만 구글 코랩 쓸 땐 ai기반 코드 작성 기능이 켜져 있으니 끄고 쓰셔야 합니다.

https://dataq.goorm.io/exam/3/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/1

 

구름EDU - 모두를 위한 맞춤형 IT교육

구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/

edu.goorm.io

실기 체험 환경을 들어가보면 알겠지만 라이브러리 임포트부터 메소드까지 직접 작성해야하기 때문에 어느정도 암기가 필요합니다. 암기하지 못한 메소드들은 help, dir, ?로 찾아서 사용할 수도 있으니 어떻게 쓰는지 꼭 알아두세요!!


 작업형 1유형

1유형은 주어진 데이터를 전처리, 계산하는 유형으로 3문제에 각각 10점씩, 총 30점 배점입니다.

난이도는 낮은 편이었는데 9회부터 갑자기 난이도가 확 뛰었다가 제가 치른 10회는 9회보단 쉽게 나왔습니다.

 

저는 우선 데이터 마님의 전처리 100제(정확히는 95제)를 다 풀었습니다.

데이터마님 유튜브 들어가면 풀이 영상이 있어서 처음엔 감을 잡기 위해서 같이 풀면서 사용되는 함수들을 표로 정리했고, 이후에는 복습하면서 어렵다 싶은 코드들은 적어놨다가 다시 푸는 식으로 공부했던 것 같습니다.

근데 너무 어렵다 싶은 문제들(ex. 따로 함수를 만들어준다던가) 까지의 난이도는 시험에 출제된 적이 없어서 넘어가도 괜찮지 않을까..싶었습니다.

 

[데이터 마님] 다회독 후에는 데이터코드랩 작업형 1유형 30제를 풀었습니다.

유형이 다양하고 난이도도 실기 시험이랑 유사한 수준인 듯해서 추천합니다.

데이터 마님 먼저 풀었다면 어렵지 않으니 혼자 풀어보고, 영상보면서 풀이 듣고 하는 식으로 풀어보세요!!

(개인적으로 groupby, sort, datetime타입 다루기, 결측치 처리는 자주 나오니 필수로 알고 있어야하는 것 같습니다!)

 

https://www.datamanim.com/dataset/99_pandas/pandasMain.html#google_vignette

 

판다스 연습 튜토리얼 — DataManim

판다스 연습 튜토리얼 10회 빅분기 실기 대비 강의, 블로그만으로는 도저히 안되겠다ㅠ 하시는분들에게 추천합니다. 아 제발 광고 한번씩만 눌러주세요 ㅠㅠ 두번은 더 좋구요 오픈톡방 (pw: dbsca

www.datamanim.com

https://youtu.be/jRDO3elswQg?si=GEilDD0s1Q5SJs6F

데이터코드랩

작업형 2유형

2유형은 데이터 모형 구축 및 평가 유형으로 성능 결과에 따라 점수를 줍니다. 1문제에 40점 배점입니다.

여기서 점수를 얻지 못하면 떨어진다는 말이 있을 정도로 중요하긴한데, 지금까지 출제된 유형은 분류, 회귀 2가지 뿐이고 두 유형끼리도 모델이랑 평가지표만 다르고 과정은 같아 외울 양도 적은 편입니다.

그리고 유튜브에 떠도는 랜덤포레스트 코드 템플릿만 외워가도 높은 점수를 얻는 경우가 많습니다. 

실제로 10회도 여러가지 모델을 돌려봤지만 역시나 랜덤포레스트가 제일 성능이 좋았습니다

(이래서 무지성랜포..랜포.. 하는구나)

 

저는 데이터 코드랩 AI 너는 아니 AI you know? 유튜브로 2유형을 공부했습니다.

[데이터 코드랩]은 처음 2유형을 풀려고 할 때 어떻게 해야 하는지 유형별로 이해하기에 좋았던 것 같고,

[AI 너는 아니 AI you know?]에서는 시험용 코드 템플릿을 알려줘서 외운 후 그대로 적용시키면 돼서 좋았습니다.  

저는 이해가 어느 정도 돼야 암기가 되는 타입이라 이렇게 봤는데, 시간이 정없다 하시면 시험용 코드 템플릿 영상만 보셔도 될 것 같습니다..ㅋㅋ (무지성 랜포 갈겨)

https://youtu.be/PxlXS7hFySw?si=bunmGq0FVBoVIYrW

데이터 코드랩

 

https://youtu.be/JSBjZv2BUxc?si=LsWdL7QLT78oKYmy

AI 너는 아니 AI you know?

 


작업형 3유형

3유형은 가설검정 및 결과 해석 유형입니다. 2문제에 각각 15점씩 총 30점 배점입니다.

23년도 6회부터 바뀐 유형이라 기출이 많진 않은데 7회부터 다중선형회귀, 로지스틱 회귀 두 유형만 나오고 있습니다.

이번 10회도 똑같이 나와서 걱정과 달리 쉽게 풀었던 것 같습니다ㅎㅎ

 

이번에 바뀐 실기체험환경 문제가 '합동분산추정량' 같은 이론적 내용을 알고 있어야 풀 수 있는 문제로 바뀌면서 출제되지 않았던 유형에 대한 불안감이 커져서 데이터코드랩 데이터 서핑 앤 노트를 통해 3유형의 전반적인 이론공부?를 하긴 했습니다. 어떤 문제에 어떤 검정이 사용되고, 통계값을 보는 방법이나 귀무가설 판단방법을 알 수 있어서 이해하는 데에 도움이 많이 되더라구요.

그리고 결정적으로 도움이 된 코드는 어디서 공부한 지 기억은 안나는데.. 밑에 적어둔 formula 코드들을 알아두었더니 역시나 똑같은 유형으로 나와 쉽게 풀 수 있었습니다.

from statsmodels.formula.api import ols, logit

model = ols('종속변수 ~ 독립변수1 + 독립변수2 ...', data=데이터프레임명).fit() # 다중회귀유형

model = logit('종속변수 ~ 독립변수1 + 독립변수2 ...', data=데이터프레임명).fit() # 로지스틱유형
print(model.summary())

 

https://youtu.be/isMwGbXo-z0?si=MAEplCMKmUDjJpek

데이터 서핑 앤 노트

 


기출문제 풀기

유료 강의를 듣지 않다보니 기출문제들을 구하는 데에 시간이 좀 걸렸었는데요..ㅜㅜ

그래도 시험 직전까지 어찌저찌 다 구해서 한번씩 풀어보고 갈 수 있었습니다..!

 

2~7회 : 밀리의 서재 첫달 무료 이벤트로 가입 후 2024 SD에듀 빅분기 실기 책에 있는 기출 풀기

6~9회 : 에이치데이터랩 가입 후 자료실에서 빅분기 실기 데이터 다운,  홍쌤의 데이터랩 기출문제 풀이 영상에서 문제 찾아서 풀고 풀이 듣기

 

그리고 추가로 에이치데이터랩에서 기출예상문제도 줘서 마지막날엔 그것만 풀고 갔습니다

(예상 문제 난이도는 시험보다 좀 더 어려웠어요)

https://www.hdatalab.co.kr/

 

에이치데이터랩

ALL CONTENTS 에이치데이터랩의 모든 콘텐츠를 소개합니다.

hdatalab.co.kr

https://youtu.be/8KN3VQrYCnQ?si=B_cwstZTYl5BAwNS

 


 

10회 시험 후기

[시험 전 주의사항]

  • 시험시작시간은 10:00 지만 입실은 9:10~30 필수!!
  • 신분증 필수, 수험표는 없어도 된다고 하는 곳도 있고 아닌 고사장도 있음.
  • 음료는 뚜껑있는 음료만 가능

전날 기출예상문제가 생각보다 많아서 늦게까지 공부하던 저는 결국 3시간만 자고 일어났습니다...

그리고 출발 전 지갑을 못찾아서 결국 여권을 들고 시험을 치러 갔던...ㅎ

 

시험장 도착해서는 3유형 정리해둔 노트 읽다가 9시 반부터는 모든 소지품 다 넣고 시험환경을 테스트하는 시간을 가졌습니다.

그리고 이때 시험 끝내기 버튼을 눌렀는데 아예 시험시작하기도 전에 잘못 끝낸 줄 알고 당황했다가 (ㄷㄷ)

시험시간이 되니 다시 시험환경을 들어갈 수 있도록 버튼이 활성화돼서 시험을 쳤습니다ㅋㅋ

그리고 처음 문제를 마주했을 땐 실기 체험환경에 나온 문제보다 많기도 하고 잠을 적게 자서 문제가 눈에 안들어오더라구요 살짝 당황했지만 열심히 집중하려고 노력했습니다..

1유형

groupby, sort, mean 등 역시나 자주 나오는 메소드들을 사용하는 문제가 대부분이었고 소문제 하나가  str.split과 len을 써서 단어 수를 세는 게 있었는데, 메소드가 기억 안나서 dir로 결국 찾아서 다 풀었습니다.

 

2유형

문제는 회귀유형이었고 데이터에 결측치도 없고 랜포를 쓰니 스케일링도 필요없어서 아주 쉽다고 생각했었는데,

시험 끝나고 문제에서 타겟값 결측치가 0으로 대체됐다는 문구를 가지고 결측치 처리를 해야한다vs안해도 된다로 이슈가 있었습니다. 저는 이미 0으로 처리됐다고 이해해서 굳이 해주지 않았는데 평균값으로 처리해준 사람들 rmse가 더 낮게 나왔다나 뭐라나.. 근데 점수를 보면 하던 안하던 상관 없었나봅니다..ㅎㅎ 오히려 잘못 처리해서 점수 깎인 경우도 있는 것 같았어요!

 

3유형

다중선형회귀, 로지스틱회귀가 이번에도 나왔고 이론을 알아야만 하는 문제들은 없었기 때문에 formula코드들을 사용해서 다 풀었습니다.

 

시험을 다 풀고 나니 1시간 반정도 소요됐고, 30분 정도 검정 후 제출하고 나왔습니다.

2유형 이슈때문에 불안하기도 했는데 결론은 만점이네요ㅎㅎ

10회차가 쉬운 편이어서 만점이신 분들이 많아보였어요 그래서 다음 11회차는 더 어려워질 것 같으니 더 단단히 준비하시는 게 좋을 것 같다고 생각합니다..

 

여기까지 읽어주신 분이 있을 진 모르겠지만.. 만약 있다면 긴 글 읽어주셔서 감사하고 꼭 도움이 됐으면 좋겠습니다.

모두들 시험 퐈이팅😁