일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- overfitting
- 회귀분석
- Udacity
- ubuntu
- deep learning
- GitHub
- regression
- feature scaling
- 주피터테마
- random forest
- Machine Learning
- 주피터 노트북 테마
- 주피터노트북 커널 목록
- 나는리뷰어다2021
- Linear Regression
- 한빛미디어
- 주피터노트북 커널 제거
- deeplearning
- lol api
- 경사하강법
- Git
- 딥러닝
- pandas
- 주피터노트북
- Python
- 데이터분석
- MySQL
- 모두를 위한 딥러닝
- jupytertheme
- 주피터노트북 커널 추가
- Today
- Total
목록Python (17)
유승훈

이번 챕터는 회귀분석에 대한 내용입니다. 보충이 필요한 내용은 학교에서 들었던 회귀분석 강의 내용을 첨부했습니다. 이전 강의에서 배웠던 알고리즘들이 이산형 Y 문제를 푸는 것들이었습니다. 하지만 데이터로 푸는 문제가 Y를 이산형으로 가질수도 있습니다. 키, 몸무게, 집값 등등.. 이산형 Y인 문제를 푸는 알고리즘들 중 회귀분석(Regression)이 있습니다. 간단하게 데이터를 가장 잘 설명하는 선을 긋는 알고리즘이라고 이야기 할 수 있습니다. 독립변수가 하나인 단순회귀분석은 Y=aX+b의 형태로 정의됩니다. 예시에서는 Y가 net worth, X가 Age가 됩니다. 기울기(Slope)인 a는 X의 변화에 따른 Y의 변화량을 의미합니다. a가 커질수록 X의 변화에 따른 Y의 변화량은 커지고, 반대로 a가..

이번 챕터는 강의가 별로 없었습니다. 간단한 내용을 소개하고, Enron Dataset을 활용하여 퀴즈를 푸는 식이었습니다. 챕터라기 보다는 앞의 챕터에서 부족했던 내용을 살짝 보충하는 느낌이었네요. 파산한 Enron이라는 회사의 이메일 데이터를 소개하고 있습니다. 이 회사는 기업사기, 비리의 대표적인 사례로 꼽히고 있는데, 메일 데이터를 통해 사람들이 보고자 하는 것은 여러가지가 있을 수 있습니다. 범죄혐의가 발각되어 기소된 사람일 수 있고, 벌금만 내고 기소되지 않고 나온 사람일 수 있고, 아니면 면죄를 대가로 증언을 한 사람일수도 있습니다. 어떤 사람을 분류해내느냐에 따라서 Task가 달라집니다. 다음으로는 Train Data의 Size에 대해 이야기하고 있습니다. Enron 데이터를 통해 분류문제..

GitHub - seunghunii/tistory_codes Contribute to seunghunii/tistory_codes development by creating an account on GitHub. github.com 1. 기본설명 Dacon 대회를 참가하던 중에 좌표 데이터를 주소로 변환해서 활용해보고자 찾아보던 중 Kakao API를 사용하기로 했습니다. 사용하는 김에 정리하는 글을 작성하고 있습니다. Kakao Developers 카카오 API를 활용하여 다양한 어플리케이션을 개발해보세요. 카카오 로그인, 메시지 보내기, 친구 API, 인공지능 API 등을 제공합니다. developers.kakao.com 우선 로그인을 하고, 어플리케이션을 추가합니다. 만드는 것은 간단하므로 따로 설..

Decision Tree는 분류(Classification)와 회귀(Regression)문제를 둘 다 풀 수 있는 알고리즘입니다. 변수들에 조건을 붙여서 데이터들을 분류하는 방식으로 모델을 만듭니다. 데이터를 나눌때 우리는 Decision Boundary를 설정합니다. 데이터를 어떤 변수를 기준으로 어떻게 Split할지를 정하는 것입니다. 가장 위의 그림을 보면, 파란색(Fast)과 빨간색(Slow) 각 Class에서 3개의 Data Point 때문에 Decision Boundary가 길게 삐져나와 있는 것을 볼 수 있습니다. 극히 일부의 데이터 때문에 분류영역이 생성된 것인데, 이는 Overfitting(과적합) 문제를 의심해볼 수 있습니다. Decision Tree의 Parameter들을 통해 이를 ..