Scale-invariant feature transform

Scale-invariant feature transform (בר"ת: SIFT), ובתרגום מילולי: "התמרת מאפיינים שאינם תלויים בקנה מידה" הוא אלגוריתם בראייה ממוחשבת לזיהוי, תיאור והתאמת מאפיינים בתמונות, שהומצא על ידי דיוויד לואו הקנדי בשנת 1999.^[1] האלגוריתם משמש בזיהוי אובייקטים, מיפוי, ניווט, תפירת תמונות, מידול תלת-ממדי, זיהוי מחוות, עקיבה והתאמת תמונה.^[2]

תיאור

מבצעים על התמונה החלקה באמצעות טשטוש גאוסי(אנ') באמפליטודות שונות. פעולה זו מבצעים ברמות רזולוציה משתנה כך שנקודות עניין לא יהיה תלויות בקנה מידה (כדוגמת התקרבות לאובייקט).

מבצעים חיסור בין התמונות ומחלצים נקודות קיצון- נקודות עניין פוטנציאליות. כלומר נקודות שהן קטנות או גבוהות מ-8 נקודות השכנות המקיפות אותן.

מסננים נקודות בעלי קונטרסט נמוך.
מחשבים שינוי גרדיאנט בסביבת נקודות העניין.
מבצעים היסטוגרמה עבור כיוונים שונים על שינוי הגרדיאנט. מנרמלים לפי הזווית שקיבלה את הערך המקסימלי כך שמתקבל וקטור המתאר את סביבת נקודת העניין ובלתי תלוי לסיבוב.

שימושים

ניתן לבצע השוואה בין התיאור הוקטורי של נקודות העניין בין שתי תמונות במטרה למצוא זוגות של נקודות עניין בעלי מאפיינים דומים. כלומר שהמרחק וקטורי התכונה שלהם במרחב האוקלידי קטן. ולקבל את ההסתברות לנוכחות אובייקט בתמונה אחרת.

הערות שוליים

^ Lowe, David G. (1999). "Object recognition from local scale-invariant features" (PDF). Proceedings of the International Conference on Computer Vision. Vol. 2. pp. 1150–1157. doi:10.1109/ICCV.1999.790410.
^ מי שמביט בי מהצד יודע מי אני, צבר דולב 2020, "מדע גדול, בקטנה"

[Lowe1999-1] Lowe, David G. (1999). "Object recognition from local scale-invariant features" (PDF). Proceedings of the International Conference on Computer Vision. Vol. 2. pp. 1150–1157. doi:10.1109/ICCV.1999.790410.

[2] מי שמביט בי מהצד יודע מי אני, צבר דולב 2020, "מדע גדול, בקטנה"

[1]

[2]