Distanzfunktionen oder Ähnlichkeitsmaße beschreiben den Grad der Übereinstimmung von Vektoren.
In typischen Anwendungen stellen die Vektoren Folgen von Messwerten dar. Ähnlichkeitsmaße werden in Auswertemethoden wie dem Vektorraum-Retrieval und dem Clustering benutzt.
Als Distanzfunktion lassen sich verschiedene Metriken verwenden. Distanzfunktionen werden oft auch unpräzise als Metrik bezeichnet; nicht alle Distanzfunktionen sind jedoch Metriken im streng mathematischen Sinne.
Häufig verwendete Distanzfunktionen
Siehe auch: Metrischer Raum
Cosinus-Distanzfunktion
Es wird vorausgesetzt, dass wir einen Vektorraum über den reellen Zahlen haben.
Die Distanz ist der Cosinus des Winkels zwischen den Vektoren
Dabei ist
.
Dice-Distanzfunktion
Dabei ist
.
Jaccard- (oder Tanimoto)-Distanzfunktion