לדלג לתוכן

Scale-invariant feature transform

מתוך ויקיפדיה, האנציקלופדיה החופשית

Scale-invariant feature transform (בר"ת: SIFT), ובתרגום מילולי: "התמרת מאפיינים שאינם תלויים בקנה מידה" הוא אלגוריתם בראייה ממוחשבת לזיהוי, תיאור והתאמת מאפיינים בתמונות, שהומצא על ידי דיוויד לואו הקנדי בשנת 1999.[1] האלגוריתם משמש בזיהוי אובייקטים, מיפוי, ניווט, תפירת תמונות, מידול תלת-ממדי, זיהוי מחוות, עקיבה והתאמת תמונה.[2]

התאמת תמונה באמצעות אלגוריתם SIFT. הקווים הירוקים מחברים נקודות עניין בעלי התאמה גבוהה

תיאור

  • מבצעים על התמונה החלקה באמצעות טשטוש גאוסי(אנ') באמפליטודות שונות. פעולה זו מבצעים ברמות רזולוציה משתנה כך שנקודות עניין לא יהיה תלויות בקנה מידה (כדוגמת התקרבות לאובייקט).
אותה תמונה עם טשטוש גאוסי באמפליטודות שונות(משמאל לימין) ב-3 רמות של קנה מידה(מלמעלה למטה)
  • מבצעים חיסור בין התמונות ומחלצים נקודות קיצון- נקודות עניין פוטנציאליות. כלומר נקודות שהן קטנות או גבוהות מ-8 נקודות השכנות המקיפות אותן.
הפרש בין תמונות
  • מסננים נקודות בעלי קונטרסט נמוך.
  • מחשבים שינוי גרדיאנט בסביבת נקודות העניין.
  • מבצעים היסטוגרמה עבור כיוונים שונים על שינוי הגרדיאנט. מנרמלים לפי הזווית שקיבלה את הערך המקסימלי כך שמתקבל וקטור המתאר את סביבת נקודת העניין ובלתי תלוי לסיבוב.


תיאור גרפי של חישוב הגרדיאנטים בכיוונים שונים (בשמאל) והיסטוגרמת הגרדיאנטים (בימין) בסביבת נקודת העניין

שימושים

ניתן לבצע השוואה בין התיאור הוקטורי של נקודות העניין בין שתי תמונות במטרה למצוא זוגות של נקודות עניין בעלי מאפיינים דומים. כלומר שהמרחק וקטורי התכונה שלהם במרחב האוקלידי קטן. ולקבל את ההסתברות לנוכחות אובייקט בתמונה אחרת.

נקודות נקודות עניין בתמונה לפני ואחרי סינון

הערות שוליים

  1. ^ Lowe, David G. (1999). "Object recognition from local scale-invariant features" (PDF). Proceedings of the International Conference on Computer Vision. Vol. 2. pp. 1150–1157. doi:10.1109/ICCV.1999.790410.
  2. ^ מי שמביט בי מהצד יודע מי אני, צבר דולב 2020, "מדע גדול, בקטנה"