לדלג לתוכן

Scale-invariant feature transform

מתוך ויקיפדיה, האנציקלופדיה החופשית

Scale-invariant feature transform (בר"ת: SIFT), ובתרגום מילולי: "התמרת מאפיינים שאינם תלויים בקנה מידה" הוא אלגוריתם בראייה ממוחשבת לזיהוי, תיאור והתאמת מאפיינים בתמונות, שהומצא על ידי דיוויד לואו הקנדי בשנת 1999.[1] האלגוריתם משמש בזיהוי אובייקטים, מיפוי, ניווט, תפירת תמונות, מידול תלת-ממדי, זיהוי מחוות, עקיבה והתאמת תמונה.[2]

תיאור מפושט

  • אוסף של נקודות עניין (כדוגמת פינות או שינוי צבע) מחולצות מתמונה ונשמרות במסד נתונים.
  • תיאור וקטורי של סביבת נקודת העניין
  • ניתן לבצע השוואה בין התיאור הוקטורי נקודות העניין בין שתי תמונות במטרה למצוא זוגות של נקודות עניין בעלי מאפיינים דומים. כלומר שהמרחק וקטורי התכונה שלהם במרחב האוקלידי קטן.
  • מתוך מערך ההתאמות, מסננים תת-קבוצה של זוגות נקודות עניין בעלי ההתאמה הגבוהה ביותר מבחינת קנה המידה והכיוון של האובייקט בתמונה. האלגוריתם מבצע את ההתאמה במהירות וביעילות תוך שימוש במבנה נתונים טבלת האש.
  • מחושבת ההסתברות שקבוצה מסוימת של מאפיינים מציינת את נוכחותו של אובייקט, בהינתן דיוק ההתאמה.
נקודות נקודות עניין בתמונה לפני ואחרי סינון

הערות שוליים

  1. ^ Lowe, David G. (1999). "Object recognition from local scale-invariant features" (PDF). Proceedings of the International Conference on Computer Vision. Vol. 2. pp. 1150–1157. doi:10.1109/ICCV.1999.790410.
  2. ^ מי שמביט בי מהצד יודע מי אני, צבר דולב 2020, "מדע גדול, בקטנה"