Distanzfunktionen oder Ähnlichkeitsmaße beschreiben den Grad der Übereinstimmung von Vektoren.
In typischen Anwendungen stellen die Vektoren Folgen von Messwerten dar. Ähnlichkeitsmaße werden in Auswertemethoden wie dem Vektorraum-Retrieval und dem Clustering benutzt.
In unpräzisem Sprachgebrauch werden Ähnlichkeitsmaße gelegentlich auch als Metriken bezeichnet; sie sind aber keine Metrik im mathematischen Sinn, denn ihr Wert nimmt zu, wenn die Distanz abnimmt.
Cosinus-Distanzfunktion
Es wird vorausgesetzt, dass wir einen Vektorraum über den reellen Zahlen haben.
Die Distanz ist der Cosinus des Winkels zwischen den Vektoren
Dabei ist
.
Dice-Distanzfunktion
Dabei ist
.
Jaccard- (oder Tanimoto)-Distanzfunktion