מה אתם רואים בתמונה פה? אם אין לכם מגבלה משמעותית בראיה, התשובה פשוטה - פיצה. עבור מחשב זה יותר קשה לענות על זה באופן חד משמעי - הוא רואה פה כתם חום-צהבהב ועליו כתמים אדומים ונקודות שחורות. לפי פייסבוק, האפליקציה שלה תדע כבר עכשיו שמדובר בפיצה, ותדע לזהות ולתאר חפצים שונים בכל תמונה.
מדובר בכלי שמיועד לעיוורים ואנשים עם מגבלות שונות בראיה.עבורם - אם מי שפירסם את התמונה לא כתב תאור מפורט של מה רואים בה - המידע הולך לאיבוד והוא לא יודע מה מצולם. פייסבוק אומרת כי "המשתמשים בתוכנות קוראי מסך במכשירי iOS (אייפונים ואייפדים) יוכלו לשמוע רשימה של פריטים אשר התמונה עשויה להכיל כאשר יעברו ויחליקו בין תמונות בפייסבוק".
זיהוי חפצים בתמונות הוא אחד האתגרים הגדולים והמעניינים בתחום הבינה המלאכותית. בעוד שעין אנושית, אפילו של תינוק, יכולה לראות ילד, פיצה, מברשת שיניים או עכבר מחשב ולזהות אותו בחלקיק השניה, מחשב לא תמיד יודע את זה באופן חד משמעי. יש אינספור סוגים של ילדים, פיצות, מברשות שיניים ועכברי מחשב שמצלמים מזוויות שונות ובתנאי תאורה שונים. אם מחשב למד איך נראית פיצה אחת, לא בטוח שהוא יודע איך נראית פיצה אחרת, או אפילו אותה פיצה שצולמה בזווית קצת שונה.
למעשה, האתגר הזה משמש להגנה מפני ספאם. לפעמים כשתנסו להרשם לאתר מסויים או לאפליקציה, תתבקשו לסמן את "כל התמונות שיש בהן חתול". מחשבים עדיין מתקשים לדעת באילו תמונות זה חתול, באילו יש כלב, ובאילו יש סתם חפצים אחרים. ככה רק בן אנוש יוכל לעבור לשלב הבא (לפחות עד עכשיו) ומחשבים לא יוכלו להירשם לאתרי הכרויות ולהציף אתכם בהצעות מפתות שיעלו לכם הרבה כסף.
פייסבוק הודיעה כבר בחודש נובמבר כי הגיעה לפריצת דרך בתחום של זיהוי חפצים כזה ושהיא מסוגלת לזהות מה רואים בתמונה. למשל, "שני אנשים מחייכים, שמיים, משקפי שמש, חוץ, מים", או "חוץ, שמיים, עצים". החל מהיום פריצת הדרך הזאת תהיה משולבת במכשירי iOS.
פייסבוק מצטרפת לגוגל, שמצד אחד יוצרת מבחני "זהה את החתול" ומצד שני מייצרת טכנולוגית "היי, אני יודעת בדיוק מה מהחפצים האלה הוא חתול". טכנולוגית זיהוי החפצים של גוגל זמינה לגוגל גלאס ובקרוב אולי גם לסמארטפונים שלכם.
מיקרוסופט הציגה השבוע גם טכנולוגיה דומה שמסייעת לעיוורים. מדובר במצלמה שמותקנת על משקפיים ומנתחת את התמונה שנמצאת מולה. בסרטון הדגמה של החברה, המצלמה מבשרת שהיא רואה "אדם קופץ באוויר כשהוא מבצע פעלול בסקייטבורד".
גם מנוע החיפוש וולפרם אלפא הציג כלי שמזינים אליו תמונה, והוא אמור להגיד מה רואים בה, אלא שהוא עדיין עושה עבודה חלקית מאוד. תמונות של אייפונים, למשל, הוא זיהה כ"לפטופ".