AI 3

[비지도 학습]k 평균 군집화

비지도 학습으로 사전에 군집수(=k)가 정해져야 알고리즘이 실행되는 비지도 학습 머신러닝 알고리즘이다. 군집수는 하이퍼 파라미터로 인간이 정해야 하고 군집의 중심 위치는 보통 랜덤하게 설정한다. k 평균 군집화는 아래의 2단계를 반복적으로 실행하며 비지도 학습을 한다. 1. 모든 개체들을 군집 중심을 통해 할당 2. 중심을 군집 경계에 맞게 새로 업데이트 예를 들어 데이터들을 2개의 군집으로 나누고 싶다고 할때 k의 값을 2로 맞추고 처음엔 k의 위치를 랜덤하게 설정, 그 후 각 데이터가 군집의 중심으로 부터 가까운것들끼리 하나의 군집으로 묶이고 다 묶이고 나면 군집의 중심을 한 가운데로 재설정 한다. 그 후 다시 개체들을 군집의 중심으로 부터 가까운 것들끼리 묶고 다 묶고 나면 군집의 중심을 가운데로 ..

AI/MachineLearning 2021.10.28

[지도학습]k-최근접 이웃 분류

k-최근접 이웃 분류(k-nearest neighbor classifier)는 지도학습으로 데이터를 가장 가까운 유사 속성에 따라 분류하는 방법 데이터로부터 거리가 가까운 K개의 다른 데이터의 레이블을 참조하여 분류하는 알고리즘(거리 측정엔 유클리드 거리 계산법을 사용) 판별하고 싶은 데이터와 인접한 k개수의 데이터를 찾아 해당 데이터의 라벨이 다수인 범주로 데이터를 분류하는 방식으로 k의 개수는 홀수를 선호하는데 짝수인 경우엔 동점이 발생할 확률이 존재하기 때문

AI/MachineLearning 2021.10.27

최대우도측정(Likelihood Maximization)

Deep Learning을 공부하다 이진분류의 오차 함수를 유도하는 과정이 있었는데 이때 이진분류 오차함수를 구하는 과정엣서 최대우도측정이라는 것을 사용했다. 그리하여 최대우도측정이란 무엇인지 공부해보았다. 최대우도측정을 말하기 전에 우선 확률부터 이야기를 해보면 확률이란 확률분포가 있을 때, 관측값 또는 관측 구간이 확률 분포 안에서 얼마의 확률로 존재하는 가를 나타내는 값이다. 즉, 특정 상황에 대한 확률분포가 있는데 이때 내가 관찰한 값이 어떤 확률을 갖는지 확률분포를 통해 알게 된다. 위와 같은 확률분포표는 중학교 때부터 많이 봐왔을것이다. 그럼 가능도(우도, likelihood)란 무엇일까? 우도란 어떤 값이 관측되었을 때, 이것이 어떤 확률 분포에서 왔을지에 대한 확률이다. 확률은 주어진 확률..

AI/DeepLearning 2021.09.09