드뎌 꿈에 그리던 ADP 실기를 봤다. 어떤 난이도인지 예상도 안됐고 기출문제도 전무후무하기 때문에 정말 가벼운 맘으로 시험보러 갔다. 하지만 그래도 난 붙겠지라는 근거 없는 자신감으로 차있었다.
시험 데이터만 딱 보고 내가 연습했었던 데이터가 나와서 할 만 하겠다라는 생각으로 문제지를 펼치고 코드를 적기 시작했다. 하지만 이는 곧 절망으로 이어졌다.
그래서 실기 시험이 끝난지 한 달 후에나 후기를 적는 것이다. 맨탈이 나갔었기 때문이다.. 본격적으로 후기를 시작하겠다.
나는 2020년 6월 21일 ADP 실기를 보러갔다. 종로에 있는 더조은 컴퓨터 학원? 그 곳에서 시험을 봤다.
전체적으로 시험장은 깔끔했다. 하지만 시험장 찾기가 조금 어려웠다.
시험장에 사람들이 들어오고 생각보다 연령층이 높다는 것을 느꼈다. 20대는 눈대중으로 나 포함 2,3명 되는 것 같고 다른 사람들은 30~50대 였던 것 같다.(아니면 죄송합니다..)
시험이 시작하기에 앞서 작업환경 설정에서 사람들이 많이 질문을 하였다. 평소에 쓰던 환경이 아니어서 그런가 싶다. 나는 jupyter notebook을 사용하여 python으로 시험을 봤는데 우분투를 이용한 가상환경에서 시험을 봤다.
비전공자인 입장에서 매우 신기할 따름이었다. 하지만 그렇다고 뭐 크게 달라지는 것은 없었다. 그냥 virtual machine 실행시키고 크롬 창 띄우면 jupyter notebook에 접속 할 수 있는 환경이 제공되어서 쉽게 들어갈 수 있었다. 그래서 크게 불편한 점은 하나도 없었다.
이제 모두가 궁금해하는 17회 복기를 해보겠다.(한달이 지나서 기억이 더듬더듬..)
우선 1번 머신러닝이었다. 데이터는 Housing data였고 California housing이 아닌 임시로 만든 듯한 data였다.
그러나 데이터 컬럼이 약간 다른 것 빼고는 거의 비슷했다. 특히 log1p로 정규화 시키는 것도 똑같아서 소름 돋았다.
기억상으로는 1-1 EDA, PreProcessing(5점) <- 100점 만점에 5점 배점이어서 충격받았다.
1-2 모델링 돌려서 예측..?, 1-3 하이퍼파라미터 조절해서 오차 줄여라 -------평가지표(RMAE 였던 것으로 기억)
다음으로 2번 문제이다. 안나오면 섭섭할 COVID-19 데이터가 나왔다.
이 데이터셋은 캐글에 있는 전세계 코로나 데이터셋과 매우 유사하다.
2-1 전체 인구대비 코로나환자가 높은 국가 top10 뽑아서 시각화 해라(일별 확진자수,일별 완치자 수 코딩 필요)
-> 데이터셋은 일별 누적확진자 데이터가 나와있음
2-2 코로나 위험지수를 직접 만들고 그 위험지수에 대한 설명을 적고 위험지수가 높은 국가들 10개를 선정해서 시각화
2-3 한국의 코로나 확진자 예측해라(선형 시계열모델 + 비선형시계열 모델 2개 만들어라)
3번은 통계분석 파트인데 이게 배점이 무려 50점이다.
3번의 데이터셋은 설문조사 데이터이다. 이 설문조사 데이터는 기본적으로 묶을 그룹이 2개이다.
A~S까지의 그룹이 각각 같은 설문조사를 하여 1-1,1-2,1-3...5-1,5-2 인 설문지를 푼 것이다. 이 때 중간에 반대 문항이 들어가 있다. 예를 들어 1-1 문제가 나는 시간약속을 잘 지킨다.라는 문제라면 1-3의 문제는 나는 시간약속을 잘 지키지 않는다. 라는 문제로 구성되어있다.
그래서 3-1 문제는 그룹별 통계치를 구하는 것이었다. 그리고 3-2문제는 탐색적 요인분석을 표로 만들어 나타내는 것이었고 3-3 문제는 기억이 안난다..
ADP 실기를 보고 느낀 것은 분석 툴을 R로 해야겠다는 것이다. 머신러닝 같은 경우는 python이 조금 유리할 수는 있어도 마지막 3번 통계 분석 문제는 R이 깡패다..
시험이 끝나고 지금까지 공부를 했던 것에 큰 회의감이 들었다. 이것도 못하나라는 생각이 들어서 매우 자괴감이 들었다..그래도 한 번 경험했으니까 이 기억으로 ADP 맞춤형 공부를 해야겠다는 생각이 들었다.
그래도 공부방법에 대해 막막한 사람을 위해 내가 했던 공부방법은 kaggle이었다.(결과는 안나왔지만 탈락 확정인 사람의 개인적인 의견입니다.) 그래도 캐글을 통해서 1,2번의 데이터가 친숙했던 것이 도움이 됐던 것 같다. 아예 처음보는 데이터 마주하는 것 보다 캐글을 통해 연습하고 많은 데이터를 다뤄보는 것이 중요하다고 생각한다.
그리고 시험을 보고 깨달은 공부 방법은 통계적 지식을 쌓고 여러 통계 기법을 데이터에 적용시키는 것이다.
이 글을 읽고 ADP 실기 준비에 조금이나마 도움이 됐으면 좋겠고 떨어지더라도 원래 어려운 시험이니까~라는 마인드로 맨탈을 빨리 회복했으면 좋겠다..
'후기' 카테고리의 다른 글
AI-HUB 아이디어 경진대회 2021 (Public 부분 최우수상 후기) (2) | 2021.12.21 |
---|---|
보아즈(BOAZ) 분석 부분 합격 후기 (10) | 2021.08.31 |
ADP(데이터 분석 전문가) 필기 (0) | 2020.02.10 |
SQLD (0) | 2020.01.07 |
정보처리기능사 (0) | 2020.01.07 |
댓글