일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- MySQL
- regression
- deep learning
- jupytertheme
- Linear Regression
- Udacity
- feature scaling
- Python
- 주피터노트북 커널 목록
- 경사하강법
- 한빛미디어
- lol api
- Git
- deeplearning
- 모두를 위한 딥러닝
- Machine Learning
- 주피터노트북 커널 추가
- ubuntu
- GitHub
- 나는리뷰어다2021
- 회귀분석
- 딥러닝
- random forest
- 주피터테마
- 주피터 노트북 테마
- 주피터노트북
- overfitting
- pandas
- 데이터분석
- 주피터노트북 커널 제거
- Today
- Total
목록전체 글 (73)
유승훈
본 도서는 한빛미디어 활동을 위해서 책을 제공받아 작성된 서평입니다. 지금까지 데이터 분석을 공부하면서 봤던 많은 책들은 처리, 시각화, 모델링 등 데이터를 다루는 것을 중심으로 했다면, 이 책은 약간 다른 방향성을 갖습니다. 데이터를 분석해 결과를 도출해 낸 뒤에 이를 어떻게하면 효율적으로 전달, 설득할 수 있을지에 대한 설명을 담고 있습니다. 데이터를 기반으로 의사결정을 하거나, 분석 결과를 전달할 때 함께하는 대상은 데이터나 통계와 관련된 지식과 경험, 이해를 가지고 있을 수도 있지만, 꼭 그러리라는 보장은 없습니다. 때문에 스토리텔링을 통해 내가 원하는 바를 잘 전달할 수 있도록 하는 것이 이 책의 중심이라고 할 수 있습니다. 기억에 남는 부분은 단순히 많은 양의 정보, 화려한 시각화가 정답은 아..
본 도서는 한빛미디어 도서 서평단 로 선정되어 받은 도서입니다. 최근에는 캐글 뿐 아니라 데이콘, 빅콘테스트, 기타 공모전 등 다양한 곳에서 데이터와 관련한 경진대회들이 열리고 있습니다. 캐글은 그 중에서도 세계적으로 유명한 플랫폼이죠. 이 책은 예측모델 경진대회에 참가하기 위한 전반적인 흐름을 다루고 있습니다. 처음에는 경진대회가 무엇인지, 어떤 흐름으로 이루어지는지에 대해 소개합니다. 대회의 종류와 방식, 좋은 성과를 내는 것, 즉 상위권에 드는 것이 어떤 의미를 갖는지, 평가는 어떻게 이루어지는지 등에 대한 이야기입니다. 그 다음에는 예측 모델을 만드는 일반적인 순서대로 진행됩니다. 결측값 처리, 변수 변환, 집계 등의 Feature(변수) 처리, 모델을 만들고, 그 성능을 평가하는 방식, 그리고 ..
이번 글은 Jupyter notebook을 커스터마이징 하는 방법에 대해서 소개해보고자 합니다. 흰 배경을 오래 보다보면 머리가 아프다거나, 다크 모드에서 글씨가 더 잘보이는 경우 등 자신이 보기 편한 방식으로 변경해주는 것이 좋다고 생각합니다. Jupyter notebook의 커스터마이징은 기본적으로 jupyterthemes 라는 패키지를 사용하는데요, 이 글을 통해 어떤 방식으로 커스터마이징 하는지를 간단히 이해한 뒤에, 필요한 옵션을 패키지의 Github Repo에서 찾아 적용해가며 자신에게 가장 잘 맞는 환경을 설정하시면 좋을 것 같습니다. dunovank/jupyter-themes Custom Jupyter Notebook Themes. Contribute to dunovank/jupyter-t..
본 도서는 한빛미디어 도서 서평단 로 선정되어 받은 도서입니다. 우리는 데이터를 활용해서 많은 문제들을 풀고자 합니다. 그 중에 하나가 미래에 대한 예측이죠. 그리고 많은 데이터들이 시간을 따라 쌓이기 때문에 시계열이라는 분야는 데이터 분석에서 아주 중요한 분야입니다. 이 책은 처음에 시계열 데이터의 예측에 대해서 소개하고 있습니다. 그 다음에는 우리가 데이터 분석에서 모델링 전에 필수적으로 거치는 과정들인 전처리, EDA와 함께 시뮬레이션을 통한 데이터 생성, 저장을 위한 데이터베이스에 대한 지식들을 각각의 장에서 소개하고 있습니다. 그 다음에는 전통적인 통계학에서 활용되는 시계열 모델들과 최근에 핫하게 활용되는 머신러닝 모델을 소개합니다. 이와 함께 시계열 데이터를 시간적인 요소를 고려하지 않는 의사..