일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- regression
- 주피터노트북 커널 추가
- Linear Regression
- Udacity
- 주피터노트북 커널 제거
- random forest
- ubuntu
- 주피터테마
- 경사하강법
- GitHub
- overfitting
- deep learning
- pandas
- 주피터노트북 커널 목록
- jupytertheme
- feature scaling
- Machine Learning
- Python
- deeplearning
- 주피터 노트북 테마
- MySQL
- 딥러닝
- 주피터노트북
- Git
- 한빛미디어
- 모두를 위한 딥러닝
- 데이터분석
- lol api
- 회귀분석
- 나는리뷰어다2021
- Today
- Total
목록Python (17)
유승훈

SVM은 두 클래스를 가장 잘 분리하는 초평면을 찾는 것입니다. 여기서 "가장 잘 분리"한다는 것은? 분리 기준에서 가장 가까운 포인트까지의 거리를 최대화하는 것입니다. 분리기준에서 가장 가까운 데이터 포인트까지의 거리를 Margin이라고 합니다. Support Vector Machine은 Margin을 Maximize 하기 전에, 데이터 분리의 정확도를 최우선으로 삼습니다. Target데이터에 따라 분리한 뒤에, Margin을 Maximize할 방법을 찾는 것입니다. 이상치가 있을 때는, Decision Boundary를 만든 뒤에, 따로 표시를 해 둡니다. 이런 이상치를 얼마나 허용할지도 조정할 수 있습니다. 비선형 SVM. 1번 그럼처럼 선형으로 분리하기 어려운 데이터는 차원을 바꿔서 선형으로 분리..

가지고 있는 동물들을 Acerous, Non-Acerous로 분류해두었다고 합시다. 여기에 새로운 동물이 들어와서 그룹 분류를 할 때, 이전에 어떤 기준으로 분류해두었는지를 봐야합니다. 분류기준은 동물의 색일수도 있고, 다리의 갯수, 뿔의 유무 등 다양한 것들이 있을 수 있습니다. 퀴즈. 네 가지 예시 중, 지도학습. 그 중에서도 분류문제에 해당하는 것은? 2번은 이전에 fraud - non fraud로 분류된 label 데이터가 없기 때문에 unsupervised learning에 해당합니다. 처음에는 fraud만 보고 classification 인 줄 알았는데, 틀리고 다시 보니 label이 없었습니다. 4번은 학습 스타일에 따라 학생들을 묶는 것이기 때문에 unsupervised learning, ..

앞서 올린 글 (Python - Concat)과 이어지는 강의내용입니다. 1. glob 여러 데이터를 하나의 데이터로 만들려면, 병합하기 전에 python에 로드된 상태여야 합니다. 데이터가 비교적 적을때에는 하나하나 불러오는 코드를 작성하는게 불편하지 않으나, 10개 100개가 되면 각각의 파일을 불러오는 코드를 작성하는게 쉽지않습니다. 그때 glob을 사용합니다. 파일명의 패턴을 매치시켜 읽어오는 방식입니다. 여기서 *나 ?를 여러 파일을 한꺼번에 지정하는 용도로 활용할수있습니다. 정규표현식에 대해서 알고있거나 활용해봤다면 이해가 쉬울것같습니다. 이런 문자들을 Wildcard Character. 와일드카드 문자라고 합니다. *는 전체를 의미합니다. '*.csv"라고 하면 해당 경로에 있는 모든 csv..

1. Tidy Data 데이터는 엄청나게 다양한 형태와 모양으로 옵니다. 세상에 다루기 편한 데이터만 있는 것은 아니기 때문에 원하는대로 데이터의 모양을 바꾸는 방법도 알 필요가 있습니다. Hardley Wickham의 "Tidy Data"라는 페이퍼에서는 데이터분석에서 사용되는 여러가지 요소들에 맞게 데이터의 형태를 바꾸는 방법을 소개하고 있습니다. 사진의 두 테이블은 정확히 같은 데이터지만, 전혀 다른 형태를 가지고 있습니다. 깔끔한 데이터에 대한 조건을 살펴보자면 각 열은 다른 변수를 가지고 있다. 각 행은 개별적인 관측치를 담고 있다. observational units form tables 이 조건을 만족하는 테이블은 둘 중 왼쪽 테이블입니다. 각 열이 이름, 치료법A, 치료법B를 담고있고, 각..