Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- Linear Regression
- MySQL
- 주피터노트북 커널 제거
- feature scaling
- 모두를 위한 딥러닝
- 딥러닝
- pandas
- Git
- Python
- overfitting
- random forest
- 주피터테마
- 주피터노트북 커널 추가
- 주피터노트북 커널 목록
- 주피터노트북
- 나는리뷰어다2021
- 주피터 노트북 테마
- 데이터분석
- regression
- 회귀분석
- deeplearning
- Machine Learning
- 한빛미디어
- Udacity
- GitHub
- lol api
- 경사하강법
- ubuntu
- jupytertheme
- deep learning
Archives
- Today
- Total
목록이상치 (1)
유승훈

이번 강의에서는 이상치, Outlier에 대해 설명하고 있습니다. Outliers, 이상치는 "평균적인 데이터의 패턴과 많이 다른 형태의 데이터"로 정의할 수 있습니다. 위의 데이터에서는 연두색으로 표시한 데이터를 이상치로 볼 수 있습니다. Outlier 하나 때문에 나머지 데이터를 잘 설명하는 Line C에서 Line A로 회귀선이 변화하는 것을 볼 수 있습니다. 이처럼 Outlier는 모델의 Error를 증가시키기도 하고, 설명력을 감소시킵니다. 회귀분석이나 분산분석같은 통계적인 기본가정들을 훼손할수도 있습니다. Outlier가 생기는 이유에 대해서 이야기해보자면, 데이터를 수집, 입력, 샘플링하는 과정에서 발생할수도 있고, 별다른 이유없이 자연적으로 생기는 경우도 있습니다. 센서 오작동이나 데이터의..
강의정리/udacity - machine learning
2021. 1. 18. 17:55