Zum Inhalt springen

Scale-invariant feature transform

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 26. September 2007 um 14:57 Uhr durch Simplicius (Diskussion | Beiträge) (AZ: Die Seite wurde neu angelegt.). Sie kann sich erheblich von der aktuellen Version unterscheiden.
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Scale-invariant feature transform, kurz SIFT, ist ein Algorithmus, um Objekte in verschiedenen Abbildungen wiederzuerkennen. Er ist unabhängig vom Maßstab, Drehung und teilweise auch der Lichtverhältnisse. Er wurde von David Lowe an der University of British Columbia im Jahre 1999 veröffentlicht, der an ihm auch ein Patent inne hat. Anwendung findet der Algorithmus unter anderem bei der Bilderkennung und beim Stitching. Es wird vermutet, dass die neuronalen Netze des Gehirns Bilder ähnlich analysieren.

Die Bilder werden im ersten Schritt mit einem Gaußfilter geglättet, um sie vom Bildrauschen zu bereinigen. Das Bild wird danach in lokale Merkmalspunkte unterteilt, die unempfindlich gegen perspektivische Verzerrung sind. Markant sind Objekte, deren Eigenschaften von ihrem Hintergrund abweicht. Sie lassen sich durch ihr Histogramm kennzeichnen, dessen Merkmale in Vektor gespeichert werden, die zum Vergleich dienen. Mit dem RANSAC-Algorithmus können jeweils mehrere, zufällig gewählte Merkmalspunkte auf eine Übereinstimmung verglichen werden.

Literatur

  • Matthew Brown, David Lowe: Automatic Panoramic Image Stitching using Invariant Features. In: International Journal of Computer Vision, Volume 74, Issue 1, August 2007 (online)
  • Thomas Läbe, Wolfgang Förstner: Automatic relative orientation of images. In: Proceedings of the 5th Turkish-German Joint Geodetic Days, March 29th - 31st, 2006, Berlin, ISBN 3-9809030-4-4 (online)