Odległość euklidesowa odpowiada normie L2 różnicy między wektorami. Podobieństwo cosinus jest proporcjonalne do produktu DOT dwóch wektorów i odwrotnie proporcjonalne do produktu ich wielkości.
- Dlaczego podobieństwo cosinus jest lepsze niż odległość euklidesowa?
- Czy odległość euklidesowa jest taka sama jak podobieństwo cosinus?
- Czy odległość cosinus jest taka sama jak odległość euklidesowa?
- Kiedy powinieneś używać podobieństwa cosinus?
Dlaczego podobieństwo cosinus jest lepsze niż odległość euklidesowa?
Podobieństwo cosinus jest korzystne, ponieważ nawet jeśli dwa podobne obiekty danych są daleko od odległości euklidesowej ze względu na rozmiar, nadal mogą mieć mniejszy kąt. Mniejszy kąt, wyższe podobieństwo.
Czy odległość euklidesowa jest taka sama jak podobieństwo cosinus?
Zastrzeżenie: W przypadku wektorów znormalizowanych (wektorów jednostkowych) podobieństwo cosinusu i odległość euklidesowa są zasadniczo równoważne (minimalizacja jednej jest równoważna maksymalizacji drugiej). Jest tak, ponieważ w przypadku wektorów jednostkowych podobieństwo cosinus jest obliczane po prostu jako produkt kropki i ′x -y′2 = 2-xty.
Czy odległość cosinus jest taka sama jak odległość euklidesowa?
Chociaż wielkość (długość) wektorów jest inna, miara podobieństwa cosinusu pokazuje, że OA jest bardziej podobne do OB niż OC. Jak widać z powyższego wyjścia, miara podobieństwa cosinus jest lepsza niż odległość euklidesowa.
Kiedy powinieneś używać podobieństwa cosinus?
2.4.
Podobieństwo cosinus mierzy podobieństwo między dwoma wektorami wewnętrznej przestrzeni produktu. Jest mierzony przez cosinus kąta między dwoma wektorami i określa, czy dwa wektory wskazują w mniej więcej w tym samym kierunku. Często jest używany do pomiaru podobieństwa dokumentów w analizie tekstu.