유승훈

실전 시계열 분석 - 통계와 머신러닝을 활용한 예측기법 본문

책 리뷰/종합 리뷰

실전 시계열 분석 - 통계와 머신러닝을 활용한 예측기법

seunghuni96 2021. 5. 24. 00:20

본 도서는 한빛미디어 도서 서평단 <나는 리뷰어다 2021>로 선정되어 받은 도서입니다.

우리는 데이터를 활용해서 많은 문제들을 풀고자 합니다. 그 중에 하나가 미래에 대한 예측이죠. 그리고 많은 데이터들이 시간을 따라 쌓이기 때문에 시계열이라는 분야는 데이터 분석에서 아주 중요한 분야입니다.

 

이 책은 처음에 시계열 데이터의 예측에 대해서 소개하고 있습니다. 그 다음에는 우리가 데이터 분석에서 모델링 전에 필수적으로 거치는 과정들인 전처리, EDA와 함께 시뮬레이션을 통한 데이터 생성, 저장을 위한 데이터베이스에 대한 지식들을 각각의 장에서 소개하고 있습니다.

 

그 다음에는 전통적인 통계학에서 활용되는 시계열 모델들과 최근에 핫하게 활용되는 머신러닝 모델을 소개합니다. 이와 함께 시계열 데이터를 시간적인 요소를 고려하지 않는 의사결정나무와 같은 모델들에 어떻게 활용하는지에 대해서도 알려주고 있습니다. 모델의 성능을 개선하고, 어떤 사항들을 고려해야하는지에 대한 가이드도 존재합니다.

 

이후에는 헬스케어, 금융 등의 실제 데이터 활용에서 시계열 분석이 어떻게 활용되는지, 그리고 시계열 분석이라는 분야에서 최근 다루어지고 있는 이슈들에 대해서 설명하고 있습니다.

 

기억에 남는 점은 R, Python 둘 다 활용하고 있다는 점입니다. 필수 배경지식으로 패키지들에 익숙해야한다고 나와있지만, R과 Python에 익숙해서 그런지 코드가 어렵게 작성되어있다고는 느끼지 못했습니다.

 

사실 책의 내용을 한번에 이해하기는 어려울 것 같습니다. 그래서 종종 보면서 시계열 데이터의 분석에 익숙해지는 과정이 필요하다고 생각합니다.

 

Comments