일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- random forest
- ubuntu
- 주피터노트북 커널 추가
- Git
- 나는리뷰어다2021
- deeplearning
- regression
- 주피터노트북 커널 목록
- 경사하강법
- 딥러닝
- 주피터노트북
- 주피터테마
- 한빛미디어
- pandas
- 주피터노트북 커널 제거
- jupytertheme
- 모두를 위한 딥러닝
- GitHub
- 주피터 노트북 테마
- 데이터분석
- Machine Learning
- MySQL
- deep learning
- feature scaling
- 회귀분석
- Linear Regression
- overfitting
- lol api
- Python
- Udacity
- Today
- Total
유승훈
파이썬으로 웹 크롤러 만들기 리뷰 본문
본 도서는 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.
이 책은 웹에 있는 다양한 데이터를 가져오는 여러가지 방법에 대해 다루고 있습니다. 크게 두 장으로 나뉘어져 있는데, 크롤링에 대한 기초개념이나 구성방식, HTML내에서 필요한 정보를 가져오는 방법등을 소개하며 단순한 크롤링을 다루는 첫번째 파트와, 로그인이 필요한 사이트, API, 이미지, 병렬처리 등 비교적 복잡한 크롤링에 대한 내용들이 들어있는 것이 두번째 파트입니다.
책 표지에 초간단이라고 쓰여있지만, 한번 정도는 크롤링을 직접 해봤거나 코드를 보면서 따라해본적이 있는 경험을 가지고 책을 보면 좋을 것 같습니다. 위에서 언급했듯 첫번째 파트에서 기초적인 부분에 대해 소개하고는 있습니다. 하지만 그 내용들만을 가지고 두번째 챕터에 소개되는 내용들을 부드럽게 이해하거나, 원하는 사이트에 직접 적용하여 데이터를 가져오는 것은 쉽지 않을 것 같습니다. 크롤링에 대해 약간은 이해하고 있어야 책을 이해해나가는데 더 수월할 것 같다고 느꼈습니다.
사실 개인적으로 크롤링은 책을 보면서 공부하는 것 보다는, 원하는 사이트에서 데이터를 직접 크롤링하면서 가장 많이 배울 수 있다고 생각합니다. 저도 크롤링을 익힐 때 책이 아니라 여러 사이트를 크롤링해보고, 막히는 부분을 헤쳐나가는 과정에서 가장 많이 배웠습니다. 하지만 본 책도 많은 크롤링 경험을 가지고 작성되었기 때문에, 크롤링하다가 막히는 부분을 해결하는 힌트를 찾거나, 폭넓은 크롤링 방식을 접할 수 있다는 점에서 긍정적이라고 생각합니다.
'책 리뷰 > 종합 리뷰' 카테고리의 다른 글
혼자 공부하는 파이썬(혼공파) 리뷰 (0) | 2021.10.22 |
---|---|
데이터 스토리 리뷰 (0) | 2021.07.26 |
데이터가 뛰어노는 AI 놀이터, 캐글 리뷰 (0) | 2021.06.21 |
실전 시계열 분석 - 통계와 머신러닝을 활용한 예측기법 (0) | 2021.05.24 |
친절한 딥러닝 수학 (0) | 2021.04.18 |