유승훈

Intro to machine learning - (2) Support Vector Machine 본문

강의정리/udacity - machine learning

Intro to machine learning - (2) Support Vector Machine

seunghuni96 2020. 11. 8. 18:39

SVM은 두 클래스를 가장 잘 분리하는 초평면을 찾는 것입니다.

여기서 "가장 잘 분리"한다는 것은? 분리 기준에서 가장 가까운 포인트까지의 거리를 최대화하는 것입니다.

분리기준에서 가장 가까운 데이터 포인트까지의 거리를 Margin이라고 합니다.

 

Support Vector Machine은 Margin을 Maximize 하기 전에, 데이터 분리의 정확도를 최우선으로 삼습니다.

Target데이터에 따라 분리한 뒤에, Margin을 Maximize할 방법을 찾는 것입니다.

 

이상치가 있을 때는, Decision Boundary를 만든 뒤에, 따로 표시를 해 둡니다. 이런 이상치를 얼마나 허용할지도 조정할 수 있습니다.

 

비선형 SVM.

1번 그럼처럼 선형으로 분리하기 어려운 데이터는 차원을 바꿔서 선형으로 분리할 방법을 찾습니다. 이를 다시 x-y차원으로 가져오면, 비선형 분리가 되는것을 볼 수 있습니다.

 

SVM의 Parameter C.

C는 SVM이 Decision Boundary의 유연함과 Train Data를 올바르게 분리하는 것 사이의 중간점을 설정합니다.

 

SVM의 Parameter Gamma.

Gamma는 데이터 포인트 하나하나의 거리가 미치는 영향을 조정합니다. 이는 Decision Boundary의 형태를 바꿉니다.

값이 커질수록 경계 가까이에 위치한 데이터 포인터들의 영향을 많이 받습니다.

 

Comments