Zum Inhalt springen

Gabor-Filter

aus Wikipedia, der freien Enzyklopädie

Ein Gabor-Filter ist ein in der Bildverarbeitung und der Signalverarbeitung benutzter Filter. Er ist nach Dennis Gabor benannt, der ihn als 1D-Filter für die Signalverarbeitung vorschlug.[1] Das Gabor-Filter wurde von Gösta Granlund auf die Anwendung für 2D-Bilder verallgemeinert.[2] Das Gabor-Filter ist ein linearer Filter und wird vielfach als Vorverarbeitung zur Extraktion von Kanten und Linien in der Bildanalyse verwendet.[3]

In neurophysiologischen Untersuchungen konnte gezeigt werden, dass das Übertragungsverhalten des visuellen Systems höherer Lebewesen in einer bestimmten Verarbeitungsstufe, im Bereich der sogenannten einfachen Zellen, erstaunlich genau durch Gaborfunktionen modelliert werden kann.[4][5][6] Die zwei existierenden Theorien über das visuelle System, auf der einen Seite das Modell der lokalen rezeptiven Felder von Hubel und Wiesel[7] und auf der anderen Seite das visuelle System als Fourieranalysator[8] konnten durch dieses Modell erweitert und in gewisser Weise vereint werden.

Eine weitere wesentliche Eigenschaft der Gabor-Filter ergibt sich durch die spezielle Form der Filterfunktion. Gabor[1] konnte zeigen, dass die nach ihm benannten Elementarsignale die Unschärferelation der Informationstheorie durch ihr minimales „Zeit-Bandbreite-Produkt“ an der unteren Grenze erfüllen. Für die Bildverarbeitung ergibt sich hieraus die Möglichkeit, Bilder frequenzselektiv bei optimaler Auflösung im Orts- und Ortsfrequenzbereich zu filtern. Wird der Filter so eingestellt, dass die Filterübertragungsfunktion keinen Gleichanteil aufweist und für negative Frequenzen verschwindet, spricht man von einem Quadraturverhalten. Diesen Filtern kommt in der Stereobildverarbeitung eine besondere Rolle zu, da sich die lokalen Bildverschiebungen (Disparitäten), die zur Tiefenrekonstruktion verwendet werden, aus der Phaseninformation der Filterantworten ermitteln lässt.[9]

Impulsantwort eines 2D Gabor-Filters mit Quadraturverhalten a) Realteil b) Imaginärteil[10]

In der Signalverarbeitung kommen im Wesentlichen 1D und wie im Bereich der Bildsignalverarbeitung 2D Filter zum Einsatz. 2D-Garborfilter lassen sich wie folgt beschreiben: Wenn x=[x1 x2]T die Bildkoordinaten sind, dann ergibt sich die Impulsantwort g(x) eines Gabor-Filters in exponentieller Schreibweise zu:

Die Matrix A beschreibt hierbei die Form der Gauß'schen Einhüllenden des Filters.

Der Vektor k0 bestimmt die Bandbreite und die Orientierung des Filters in der Bildebene. Wird der Filter derart eingestellt, dass die Modulationsrichtung in eine der Achsen der Gauß'schen Einhüllenden (Matrix A) zeigt, mit:

ergibt sich eine Impulsantwort des Filters wie sie in der Abbildung dargestellt ist.[10]

Feature Extraktion aus Bildern

[Bearbeiten | Quelltext bearbeiten]
Übertragungsfunktionen einer Gaborfilterbank als dreistufige Auflösungspyramide mit Quadraturverhalten, wobei die Ergebnisse mit 2n komprimiert werden können.[3][10]
Gaborfilterbank im Ortsfrequenzraum als zweidimensionale Auflösungspyramide mit einer Orientierungsauflösung von Δφi=30°. Gezeigt sind die Halbwertskonturen der einzelnen Übertragungsfunktionen.[3][10]

Eine Filterbank aus mehreren Gabor-Filtern mit unterschiedlichen Frequenzen und Orientierungen kann benutzt werden, um verschiedene Merkmale (Features) in einem Bild zu erkennen.[11]

Werden die Filter dabei in Oktaven mit logarithmisch zunehmender Bandbreite eingeteilt, ergibt sich eine Auflösungspyramide mit der sich Grob-Feinstrategien in der Bildverarbeitung realisieren lassen. Hierbei können die Filterergebnisse bei Einhaltung des Shannon-Abtasttheorems entsprechend komprimiert werden, um den Berechnungsaufwand der nachfolgenden Verarbeitungsschritte zu reduzieren.[10][3]

Die Übertragungsfunktion G(k) eines Gabor-Filters im (Orts-)Frequenzbereich (Fouriertransformation der Impulsantwort g(x)) ist definiert durch:

wobei k=[k1 k2]T der räumliche Frequenzvektor bzw. der Ortsfrequenzvektor ist. Soll nun das Eingangsbild mit N Filtern unterschiedlicher Auflösung in Form einer Oktavbandeinteilung gefiltert werden, können die Modulationsfrequenzen k0n wie folgt gewählt werden:

 ;

Die Filterergebnisse können anschließend mit dem Faktor 2n ohne Informationsverlust komprimiert werden.

Um gerichtete Informationen, wie Linien- oder Kantenverläufe aus Bilddaten zu extrahieren, können M 2D-Garbor-Filter mit unterschiedlichen Orientierungen und Modulationsfrequenzvektoren verwendet werden.

 ;

In der Stereobildverarbeitung bieten orientierungsselektive Gabor-Filter die Möglichkeit, gerichtete Intensitätsänderungen (z. B. Kanten- oder Linienstrukturen) orthogonal zur Stereobasis (im Stereonormalfall) aus den Bilddaten herauszufiltern, um die Robustheit bei der Zuordnung korrespondierender Bildbereiche zu erhöhen (siehe Korrespondenzproblem).[12]

In der Texterkennung sind Gabor-Filter geeignet, um Schriftzeichen in mehrsprachigen Dokumenten zu erkennen.[13] Gabor-Filter mit verschiedenen Frequenzen und Orientierungen können benutzt werden, um Textfelder aus komplexen ein- und mehrfarbigen Dokumenten-Scans zu extrahieren, da Text im Vergleich zu Bildern oder Zeichnungen mehr hochfrequente Anteile besitzt.[14][15] Weitere Anwendungen besitzt der Filter in der Emotionserkennung[16] und der Mustererkennung in der Medizin.[17] Weitere Anwendungsbereiche im Bereich Bilderkennung sind die Iris-Erkennung, die Erkennung von Fingerabdrücken und Landnutzungsklassifizierung von Satellitendaten.[18]

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. 1 2 Gabor, D.: Theory of communication. In: J. Inst. Electr. Eng. 93. Jahrgang, 1946 (englisch).
  2. Granlund G. H.: In Search of a General Picture Processing Operator. In: Computer Graphics and Image Processing. 8. Jahrgang, Nr. 2, 1978, ISSN 0146-664X, S. 155–173, doi:10.1016/0146-664X(78)90047-3 (englisch).
  3. 1 2 3 4 Ulrich Büker, Siegbert Drüe, Nicolai Götze, Georg Hartmann, Björn Kalkreuter, Ralf Stemmer, Ralph Trapp: Vision based Control of an autonomous Disassembly Station. In: Robotics and Autonomous Systems. Band 35. North-Holland, Juni 2001, ISSN 0921-8890, S. 179189, doi:10.1016/S0921-8890(01)00121-X.
  4. Olshausen, B. A. & Field, D. J.: Emergence of simple-cell receptive-field properties by learning a sparse code for natural images. In: Nature. 381. Jahrgang, Nr. 6583, 1996, S. 607–609, doi:10.1038/381607a0, PMID 8637596, bibcode:1996Natur.381..607O (englisch).
  5. S. Marčelja: Mathematical description of the responses of simple cortical cells. In: Journal of the Optical Society of America. 70. Jahrgang, Nr. 11, 1980, S. 1297–1300, doi:10.1364/JOSA.70.001297, PMID 7463179, bibcode:1980JOSA...70.1297M (englisch).
  6. John G. Daugman: Uncertainty relation for resolution in space, spatial frequency, and orientation optimized by two-dimensional visual cortical filters. In: Journal of the Optical Society of America A. 2. Jahrgang, Nr. 7, 1. Juli 1985, ISSN 1084-7529, S. 1160–9, doi:10.1364/JOSAA.2.001160, PMID 4020513, bibcode:1985JOSAA...2.1160D (englisch).
  7. D. H. Hubel, T. N. Wiesel: Receptive fields, binocular interaction and functional architecture in the cat‘s visual cortex. In: Journal of Physiology. Band 160. London 1962, S. 106154.
  8. F. W. Campbell, J. G. Robson,: Applications of Fourier analysis to the visibility of gratings. In: Journal of Physiology. Band 197. London 1968, S. 551556.
  9. C. Westelius, H. Knutson, J. Wiklund, C. Westin: Phase-based Disparity Estimation. In: L. Crowley, H. I. Christensen (Hrsg.): Vision as Process: Basic Research on Computer Vision Systems. Springer-Verlag, 1994, ISBN 978-3-540-58143-7, S. 157178.
  10. 1 2 3 4 5 Ralph Trapp: Stereoskopische Korrespondenzbestimmung mit impliziter Detektion von Okklusionen. Hrsg.: Georg Hartmann: HNI-Verlagsschriftenreihe. Band 43, 1998, ISBN 3-931466-42-6, urn:nbn:de:hbz:466:2-27002.
  11. M. Haghighat, S. Zonouz, M. Abdel-Mottaleb: Computer Analysis of Images and Patterns (= Lecture Notes in Computer Science. Band 8048). 2013, ISBN 978-3-642-40245-6, Identification Using Encrypted Biometrics, S. 440–448, doi:10.1007/978-3-642-40246-3_55 (englisch).
  12. Ralph Trapp, Siegbert Drüe, Georg Hartmann: Stereo Matching with Implicit Detection of Occlusions. In: Hans Burkhardt, Bernd Neumann (Hrsg.): ECCV 1998: Computer Vision — ECCV’98. Band 1407. Springer, Berlin / Heidelberg / New York 1998, ISBN 3-540-64613-2, S. 1733, doi:10.1007/BFb0054731.
  13. Peeta Basa Pati, A.G. Ramakrishnan: Word level multi-script identification. In: Pattern Recognition Letters. 29. Jahrgang, Nr. 9, Juli 2008, ISSN 0167-8655, S. 1218–1229, doi:10.1016/j.patrec.2008.01.027, bibcode:2008PaReL..29.1218P (englisch).
  14. S. Raju S, P.B. Pati, A.G. Ramakrishnan: First International Workshop on Document Image Analysis for Libraries, 2004. Proceedings. IEEE, Palo Alto, CA, USA 2004, ISBN 978-0-7695-2088-9, Gabor filter based block energy analysis for text extraction from digital document images, S. 233–243, doi:10.1109/DIAL.2004.1263252 (englisch, iisc.ac.in [PDF]).
  15. S. Sabari Raju, P. B. Pati, A. G. Ramakrishnan: Advances in Visual Computing (= Lecture Notes in Computer Science. Band 3804). 2005, ISBN 978-3-540-30750-1, Text Localization and Extraction from Complex Color Images, S. 486–493, doi:10.1007/11595755_59 (englisch, archive.org).
  16. M. Lyons, S. Akamatsu, M. Kamachi, J. Gyoba: Proceedings Third IEEE International Conference on Automatic Face and Gesture Recognition. 1998, ISBN 0-8186-8344-9, Coding facial expressions with Gabor wavelets, S. 200–205, doi:10.1109/AFGR.1998.670949 (englisch, zenodo.org).
  17. C.M. Gdyczynski, A. Manbachi: On estimating the directionality distribution in pedicle trabecular bone from micro-CT images. In: Physiological Measurement. 35. Jahrgang, Nr. 12, 2014, S. 2415–2428, doi:10.1088/0967-3334/35/12/2415, PMID 25391037, bibcode:2014PhyM...35.2415G (englisch).
  18. C. Chen, L. Zhou, J. Guo, W. Li, H. Su and F. Guo, "Gabor-Filtering-Based Completed Local Binary Patterns for Land-Use Scene Classification," 2015 IEEE International Conference on Multimedia Big Data, Beijing, China, 2015, pp. 324–329, doi:10.1109/BigMM.2015.23.

Weiterführende Literatur

[Bearbeiten | Quelltext bearbeiten]
  • Feichtinger, Hans G. (Hrsg.): Gabor analysis and algorithms : theory and applications. Birkhäuser, Boston 1998, ISBN 0-8176-3959-4 (englisch).
  • Gröchenig, Karlheinz: Foundations of time-frequency analysis : with 15 figures (= Applied and Numerical Harmonic Analysis). Birkhäuser, Boston 2001, ISBN 0-8176-4022-3, doi:10.1007/978-1-4612-0003-1 (englisch).
  • J.G. Daugman: Complete discrete 2-D Gabor transforms by neural networks for image analysis and compression. In: IEEE Transactions on Acoustics, Speech, and Signal Processing. 36. Jahrgang, Nr. 7, 1988, ISSN 0096-3518, S. 1169–1179, doi:10.1109/29.1644 (englisch, gmu.edu [PDF]).
  • Sylvain Fischer, Filip Šroubek, Laurent Perrinet, Rafael Redondo, Gabriel Cristóbal: Self-Invertible 2D Log-Gabor Wavelets. In: International Journal of Computer Vision. 75. Jahrgang, Nr. 2, 2007, ISSN 0920-5691, S. 231–246, doi:10.1007/s11263-006-0026-8 (englisch, cas.cz [PDF]).