1. 유클리드 유사도(Euclidean Similarity)
•
유클리드 거리(Euclidean distance): 두 벡터가 가리키는 점 사이의 거리
•
두 벡터의 차의 길이로 구할 수 있음
•
유클리드 유사도: 유클리드 거리와 반비례하는 값으로 정의할 수 있음
2. 코사인 유사도(Cosine Similarity)
2.1 벡터의 내적과 코사인
•
두 벡터의 내적은 다음과 같이 벡터의 길이 와 두 벡터 사이의 각도 로 계산할 수 있음
•
: 각을 가지는 직각삼각형에서 빗변 와 아랫변 의 길이의 비율
◦
의 값은 가 0에 가까워질수록 1에 가까워지고 가 에 가까워질수록 0에 가까워짐
2.2 직교(orthogonal)
•
직교: 두 벡터 와 가 이루는 각이 90도인 경우 직교한다고 하며 로 표기
•
이므로 서로 직교인 두 벡터의 내적은 0
2.3 코사인 유사도(cosine similarity)
•
두 벡터의 유클리드 거리 대신 두 벡터가 비슷한 방향을 가리키는 것을 유사하다고 볼 수도 있음
•
코사인 유사도: 두 벡터가 이루는 각의 코사인 값
◦
두 벡터가 같은 방향을 가리키면(각도가 0) 최대값 1을 가짐
•
추천시스템(recommend system)에서 사용자 취향의 유사성을 계산할 때 사용됨
•
코사인 거리(cosine distance)
참고 자료