במסגרת פרויקט מחקר מיוחד של גוגל גילתה ענקית החיפוש דרך ללמד מכונות מה נחשב מצחיק, יכולת המקנה לתוכנות הסיווג של אתר יוטיוב השייך לגוגל, לחשב את פוטנציאל ההומור של קטעי וידאו. או במילים פשוטות יותר: האלגוריתם יודע לחשב עד כמה הסרטון מצחיק.
לפי אותו אלגוריתם מתוחכם דורגו עשרת הסרטונים המצחיקים ביותר באתר. את המקום הראשון ברשימה תפס סרטון בשם Ceiling Fan Trick Knockdown המראה צעיר המנסה לאכול עגבניה התלויה מהתקרה כאשר עליו לעבור עם ראשו את מאוורר התקרה החוצץ ביניהם. אתם בטח מבינים איך זה נגמר. מצחיק? כנראה שכן.
את המקום השני תפס הסרטון My Mama Said YES והשלישי קיבל הווידאו iSlap with the iPad בו נצפים שני נערים כשאחד מכה את שני עם אייפד.
אלגוריתם לזיהוי הומור. איך זה עובד?
בדומה לדרך בה לימדו את המסווגים האוטומטיים של יוטיוב לזהות תכונות אקוסטיות בקליפים באמצעות לימוד מכונה במטרה לכמת כישרון מוזיקלי שמאפשר בין היתר לאתר הפרות של זכויות יוצרים בתחום המוזיקה.
ניסו ביוטיוב להפעיל את הטכנולוגיה עבור קטעי וידאו מצחיקים. תחילה הם ניסו לעשות זאת באמצעות אבחון דפוסים חזותיים וקוליים על פני קטעי וידאו קומיים ביוטיוב. דפוסים כמו תנועת מצלמה רועדת או קולות צחוק שאפשר לזהות באופן אוטומטי. אולם, בעוד אלגוריתם זיהוי המבוסס על תכונות אלו עבד היטב במוסיקה, בזיהוי הומור היה מדובר על אגוז קשה לפיצוח. מסתבר, כי העדפה של הומור היא סובייקטיבית, אולי אפילו יותר מאשר טעם המוזיקלי.
למזלם של החוקרים יש להם הרבה מאוד חומר מצולם לעבוד איתו והם התמקדו בקטעי וידאו שהועלו בקטגוריית קומדיה. המטרה הייתה לנסות ולתפוס את האמונה שגרמה למשתמש שהעלה את הסרטון, לחשוב שהסרטון שלו מצחיק על סמך תכונות כמו הכותרת, התיאור והתגיות שהוא הזין. גם תגובות הגולשים בצורה של הערות, הוסיפו לאמיתות הערך הקומי של הווידאו.
כך למשל הוכנסו למשוואה מילים וביטויים כמו שם "חחחחח" עם משתנים תלויי תרבות כגון hehehe, jajaja, kekeke ראשי תיבות מקובלים באינטרנט לצחוק כמו lol, lmao (סרטונים מצחיקים) ו-ROFL, מילים נרדפות למילה מצחיק, בעיקר באנגלית כמובן, סמלי הבעה (סמייליי) כגון :) או ;-), XP ותכונות נוספות.
על בסיס כל אלו אומנו המסווגים האוטומטיים לזהות קטעי וידאו מצחיקים ולומר מדוע הם מצחיקים על ידי סיווגם לז'אנרים כמו "חיות מחמד מצחיקות", "חיקויים או פארודיות", "סטנדאפ", "קונדס" ו"פרסומות מצחיקות".
בשלב הבא היו צריכים לבנות ביוטיוב אלגוריתם שיהיה מסוגל לדרג את קטעי וידאו המצחיקים לפי הפוטנציאל הקומי שלהם.
למשל, האם הסרטון "צ'רלי נשך לי את האצבע" מצחיק יותר מ"דיוויד אחרי רופא השיניים"? במקרה זה מספר הצפיות הגולמי אינו מספיק כמדד לדירוג, שכן הוא מוטה על ידי גיל החשיפה של הווידאו. ולכן, בדקו ביוטיוב כיצד הצופים מדגישים את תגובתם לקטעי וידאו מצחיקים במספר דרכים. בכתיבת הביטוי LOL באותיות גדולות, בהתארכות הביטוי loooooool, בחזרה על lolololol, בקריאה lolllll!!! ושילובים נוספים. ההיגיון אמר כי משתמש שעושה שימוש ב"loooooool" לעומת "loool", הוא משועשע יותר ולכן תיכנתו את המסווגים האוטומטיים לכמת את מידת הדגש על מילים הקשורות בהומור בתגובות הצופה.
בסופו של דבר נוצר אלגוריתם פסיבי - אגרסיבי לדירוג קטעי וידאו מצחיקים באמצעות שילוב תכונות טקסטואליות וגם ויזואליות ונוצר ה-Comedy Slam, ממשק המציג לגולשים את הסרטונים המצחיקים ביותר שנבחרו על ידי המסווגים האוטומטיים ומאפשר להם להצביע עבורם. עד היום השתמשו בו מעל 75,000 אנשים שביצעו 855,000 הצבעות.
הסרטון מצחיק או לא? טקבקו
>> השבוע בטוקבק הזהב: בר רפאלי או אביבית מהאח הגדול, מי משרבבת שפתיים יותר טוב?