Zum Inhalt springen

„Scale-invariant feature transform“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Nach Kat. Bildverarbeitung verschoben
Umstrukturiert. Originalpaper in Lit. aufgenommen.
Zeile 1: Zeile 1:
'''Scale-invariant feature transform''' ([[Englische Sprache|engl.]], „''skaleninvariante Merkmalstransformation''“, kurz '''SIFT''') ist ein [[Algorithmus]] zur Extraktion lokaler [[Interest-Operator|Bildmerkmale]] aus [[Optische Abbildung|Abbildungen]]. Er kann vor allem bei der [[Bildregistrierung]] verwendet werden. Er wurde von [[David Lowe|David G. Lowe]] an der [[University of British Columbia]] im Jahre 1999 veröffentlicht. Die Universität hat an dem Algorithmus ein US-[[Patent]] inne.<ref>[http://www.google.com/patents/US6711293 US 6711293 B1: Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image] (engl.)</ref>
'''Scale-invariant feature transform''' ([[Englische Sprache|engl.]], „''skaleninvariante Merkmalstransformation''“, kurz '''SIFT''') ist ein [[Algorithmus]] zur Detektion und Beschreibung lokaler M[[Interest-Operator|erkmale]] in Bildern. Der Detektor und die Merkmalsbeschreibungen sind, in gewissen Grenzen, invariant gegenüber [[Koordinatentransformation]]en wie Translation, Rotation und Skalierung. Sie sind außerdem robust gegen Beleuchtungsvariation, Bildrauschen und geringere geometrische Deformation höherer Ordnung, wie sie zum Beispiel durch projektive Abbildung eines Objekts von verschiedenen Standpunkten im Raum entstehen. Ursprünglich für die [[Objekterkennung]] entwickelt, kommt der Algorithmus mittlerweile in weiteren Gebieten der [[Bildverarbeitung]] zum Einsatz. Darunter z.B. die [[Bildregistrierung]] bzw. das Erstellen von Panoramabildern aus Einzelaufnahmen ([[Stitching]]), Objektverfolgung in Videos, [[Simultaneous Localization and Mapping|Navigation]] von Robotern oder [[Gestenerkennung]].


Der Algorithmus wurde im Jahre 1999 von [[David Lowe|David G. Lowe]] veröffentlicht und gilt als Referenzverfahren in seinem Einsatzgebiet. Allerdings hat die [[University of British Columbia]] an dem Algorithmus ein US-[[Patent]] inne.<ref>[http://www.google.com/patents/US6711293 US 6711293 B1: Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image] (engl.)</ref> Die grundlegenden Konzepte von SIFT finden sich jedoch in verschiedenen Weiterentwicklungen anderer Autoren wieder. Dabei konnte der Berechnungsaufwand reduziert und die Robustheit von Detektor und Merkmalsbeschreibungen verbessert werden (z.B. [[SURF]], Affine-SIFT, PCA-SIFT).
Die Bilder werden im ersten Schritt mit einem [[Gauß-Filter]] geglättet, um sie vom [[Bildrauschen]] zu bereinigen. Das Bild wird danach in lokale Merkmalspunkte unterteilt, die unempfindlich gegen perspektivische Verzerrung sind. Markant sind Objekte, deren Eigenschaften von ihrem Hintergrund abweichen. Sie lassen sich durch ihre [[Histogramm]]e kennzeichnen, deren Merkmale in [[Vektor]]en gespeichert werden, die zum Vergleich dienen.

Die extrahierten Merkmale sind unempfindlich gegenüber [[Koordinatentransformation]]en wie Translation, Rotation und Skalierung. Sie sind außerdem robust gegen Beleuchtungsvariation, Bildrauschen und geringere geometrische Deformation höherer Ordnung, wie sie zum Beispiel durch projektive Abbildung eines Objekts von verschiedenen Standpunkten im Raum entstehen.

Für die [[Objekterkennung]] können mit Hilfe des [[RANSAC-Algorithmus]] die Daten von mehreren, zufällig gewählten Merkmalspunkten verschiedener Abbildungen auf eine Übereinstimmung verglichen werden. Verwendung findet dies beispielsweise beim [[Stitching]].


== Literatur ==
== Literatur ==
* David G. Lowe: ''Distinctive Image Features from Scale-Invariant Keypoints'' In: ''International Journal of Computer Vision''. Band 60, Nr. 2, Seiten 91-110, 2004 ([http://www.cs.ubc.ca/~lowe/papers/iccv99.pdf online])
* David G. Lowe: ''Object Recognition from Local Scale-Invariant Features''. In: ''ICCV '99 Proceedings of the International Conference on Computer Vision''. Band 2, Seiten 1150-1157 ([http://www.cs.ubc.ca/~lowe/papers/iccv99.pdf online])
* David G. Lowe: ''Distinctive Image Features from Scale-Invariant Keypoints'' In: ''International Journal of Computer Vision''. Band 60, Nr. 2, Seiten 91-110, 2004 ([http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf online])
* Matthew Brown, David Lowe: ''Automatic Panoramic Image Stitching using Invariant Features.'' In: ''[[International Journal of Computer Vision]]''. Band 74, Nr. 1, August 2007 ([http://www.cs.bath.ac.uk/brown/papers/ijcv2007.pdf online]; PDF; 3,7&nbsp;MB)
* Matthew Brown, David Lowe: ''Automatic Panoramic Image Stitching using Invariant Features.'' In: ''[[International Journal of Computer Vision]]''. Band 74, Nr. 1, August 2007 ([http://www.cs.bath.ac.uk/brown/papers/ijcv2007.pdf online]; PDF; 3,7&nbsp;MB)
* Thomas Läbe, [[Wolfgang Förstner]]: ''Automatic relative orientation of images.'' In: ''Proceedings of the 5th Turkish-German Joint Geodetic Days, March 29th - 31st, 2006''. Berlin, ISBN 3-9809030-4-4 ([http://www.ipb.uni-bonn.de/papers/2006/laebe06.automatic.pdf online])
* Thomas Läbe, [[Wolfgang Förstner]]: ''Automatic relative orientation of images.'' In: ''Proceedings of the 5th Turkish-German Joint Geodetic Days, March 29th - 31st, 2006''. Berlin, ISBN 3-9809030-4-4 ([http://www.ipb.uni-bonn.de/papers/2006/laebe06.automatic.pdf online])

Version vom 4. Juni 2015, 10:29 Uhr

Scale-invariant feature transform (engl., „skaleninvariante Merkmalstransformation“, kurz SIFT) ist ein Algorithmus zur Detektion und Beschreibung lokaler Merkmale in Bildern. Der Detektor und die Merkmalsbeschreibungen sind, in gewissen Grenzen, invariant gegenüber Koordinatentransformationen wie Translation, Rotation und Skalierung. Sie sind außerdem robust gegen Beleuchtungsvariation, Bildrauschen und geringere geometrische Deformation höherer Ordnung, wie sie zum Beispiel durch projektive Abbildung eines Objekts von verschiedenen Standpunkten im Raum entstehen. Ursprünglich für die Objekterkennung entwickelt, kommt der Algorithmus mittlerweile in weiteren Gebieten der Bildverarbeitung zum Einsatz. Darunter z.B. die Bildregistrierung bzw. das Erstellen von Panoramabildern aus Einzelaufnahmen (Stitching), Objektverfolgung in Videos, Navigation von Robotern oder Gestenerkennung.

Der Algorithmus wurde im Jahre 1999 von David G. Lowe veröffentlicht und gilt als Referenzverfahren in seinem Einsatzgebiet. Allerdings hat die University of British Columbia an dem Algorithmus ein US-Patent inne.[1] Die grundlegenden Konzepte von SIFT finden sich jedoch in verschiedenen Weiterentwicklungen anderer Autoren wieder. Dabei konnte der Berechnungsaufwand reduziert und die Robustheit von Detektor und Merkmalsbeschreibungen verbessert werden (z.B. SURF, Affine-SIFT, PCA-SIFT).

Literatur

  • David G. Lowe: Object Recognition from Local Scale-Invariant Features. In: ICCV '99 Proceedings of the International Conference on Computer Vision. Band 2, Seiten 1150-1157 (online)
  • David G. Lowe: Distinctive Image Features from Scale-Invariant Keypoints In: International Journal of Computer Vision. Band 60, Nr. 2, Seiten 91-110, 2004 (online)
  • Matthew Brown, David Lowe: Automatic Panoramic Image Stitching using Invariant Features. In: International Journal of Computer Vision. Band 74, Nr. 1, August 2007 (online; PDF; 3,7 MB)
  • Thomas Läbe, Wolfgang Förstner: Automatic relative orientation of images. In: Proceedings of the 5th Turkish-German Joint Geodetic Days, March 29th - 31st, 2006. Berlin, ISBN 3-9809030-4-4 (online)
  • David G. Lowe: Method and Apparatus for Identifying Scale Invariant Features in an image and use of same for locating an object in an image Patent US 6,711,293 B1, veröffentlicht am 23. März 2004

Einzelnachweise

  1. US 6711293 B1: Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image (engl.)