טל מגד בן ה-34 מהרצליה, נשוי לעופרי ואבא לאיתן בן ה-3, החליט שעל מנת לסייע לאשתו להתמודד עם נכותה הוא מוכן להוביל חברת סטארטאפ שמטרתה לשפר את הנגישות לתקשורת ולמידע עבור קהילת החירשים וכבדי השמיעה ברחבי העולם. כך הוא מצא את עצמו ממנכ"ל את חברת VSL labs, המשתמשת בטכנולוגיה פורצת דרך של אווטרים תלת-מימדיים שמתרגמים באופן סימולטני קול וטקסט לשפת הסימנים. בעזרת טכנולוגיה זו, משתמשים יכולים לצרוך תכנים בצורה נגישה יותר ונפתחת בפניהם גישה לפלטפורמות רבות, כמו פגישות מקוונות, סרטוני וידאו ומשחקים.
"אשתי עופרי היא חירשת מגיל שלוש, בעקבות גן נדיר שקיים במשפחה", מספר מגד בשיחה עם mako. "לפני כ-8 שנים היא עברה ניתוח לשתלים קוכליאריים בשתי האוזניים. אני מכיר מקרוב את ההתמודדות של חירשים עם עולם השומעים, ואת הפערים התפיסתיים שנובעים מכך. גם ביחידת המודיעין שבה שירתי היו לא מעט חיילים מתנדבים כבדי שמיעה, כך שהעולם הזה אינו זר לי. לכן, ברמה האישית, מאוד חשוב לי שהפרויקט הזה יצליח – וכל צעד קטן הוא מרגש", הוא אומר.
מגד מספר כי אחד מהדברים שעודדו אותו להוביל את חברת VSL labs, אותה הקים גל קלקשטיין בשנת 2019, הוא החיים המורכבים לצד אשתו עופרי. "אני חי איתה ורואה כיצד אירועים שהם לכאורה פשוטים ויומיומיים עבורנו, השומעים, הופכים למאתגרים בשבילה, כמו למשל שמיעת בכי של תינוק. זה נכון גם לגבי ראיונות עבודה, לימודים, אירועים חברתיים ואפילו נסיעה בכביש. גם תכנים ברשתות החברתיות מבוססים ברובם על שמע, כך שחירשים לא יכולים ליהנות מהתכנים הללו בצורה מספקת. העולם היום לא מספיק מבין את המורכבות הזאת".
"הרוב המכריע של הטכנולוגיות לא הצליחו לייצר מוצר יעיל ונגיש"
גל קלקשטיין, שותף בחברה, הוא משקיע ויזם סדרתי המגיע מעולמות האלגוריתמיקה. קלקשטיין עצמו פיתח זרוע רובוטית לשפת סימנים, אך מהר מאוד הוא הבין שבשל מורכבות השפה, לא ניתן יהיה להמשיך עם זרוע רובוטית כפתרון למשימה. לכן, הוא עבר לפתרון אלגוריתמי-תוכנתי, ושילב את מגד בהנהלת החברה. "כאן אני נכנס לתמונה", אומר מגד ומוסיף, "אני מגיע מעולמות ה-BI (בינה עסקית) והאלגוריתמיקה, הובלתי כ-CTO כמה חברות סטארטאפ מתחום ה-AI, ולכן החיבור בינינו היה טוב ומהיר. כבר בהתחלה למדנו שיש ביקוש גדול לשילוב טכנולוגיות בקרב אוכלוסיית החירשים בארץ ובעולם, וגילינו שהרוב המכריע של הטכנולוגיות שפועלות כיום בשדה הזה פשוט לא הצליחו לייצר מוצר יעיל ונגיש שעומד בקריטריונים הבסיסיים של תרגום לשפת הסימנים".
אחד הדברים שהיו חשובים למגד, כמנכ"ל וכשותף בחברה, זה שמהיום הראשון יהיו לצד הצוות הטכנולוגי גם עובדים מהקהילה החירשת, ששפת הסימנים היא שפת האם שלהם. "ביחד פיתחנו מערכת בינה מלאכותית שמאזינה לעולם ומתרגמת אותו משפה מדוברת לשפת הסימנים, באמצעות דמות תלת ממד המדמה דמות אנושית, שמנגישה לצופה את התרגום בשפתו. כיום, המערכת יודעת לקבל טקסט או אודיו ולהוציא ממנו וידאו שמייצג את התרגום בשפת הסימנים, בזמן אמת. התוצר הזה הוא תלוי הקשר כמובן, וכולל הבעת רגשות ושפת גוף. כלומר, אותה דמות וירטואלית ממש 'יודעת' לשקף לצופה האם האדם שמדבר הוא כועס, מתרגש, שמח וכן הלאה. פיתחנו מאגרי מידע ייחודיים, ויזואליים וטקסטואליים, שאיתם אנחנו מאמנים את המודלים שלנו לתרגום אופטימלי. התוצר הסופי הוא האווטאר שמהווה את המודל הקרוב ביותר לייצוג של מתורגמן אנושי לשפת הסימנים", מסביר מגד.
"לצערנו יש לא מעט טעויות נפוצות בתחום של שפת הסימנים", אומר מגד, מתוך היכרותו האישית והמקצועית עם התחום. "אנשים רבים נוטים לחשוב ששפת הסימנים היא שפה אוניברסלית – דבר שהוא לא נכון בבסיסו. נכון להיום, יש מעל ל-200 שפות סימנים בעולם. בנוסף, תמיד אומרים לנו: 'נו, מה הבעיה? יש לחירשים כתוביות, הרי הם יודעים לקרוא'. אבל זו גם כן הנחה שגויה, כי שפת הסימנים אצל רוב האנשים מקהילת החירשים, היא שפת האם שלהם, זו הדרך שלהם לתקשר. לרוב עברית או אנגלית הן שפה שנייה או שלישית עבורם, ולכן הם לא תמיד שולטים בשפה שמופיעה בכתוביות. מה גם שבכתוביות יש חוסר בניואנסים חזותיים וקשה מאוד להעביר רגשות וטון דיבור רק דרך הקריאה", מסביר מגד.
סוגיה נוספת שעולה בהקשר הזה, אותה חברת VSL labs מנסה לפתור, היא שכיום אין מספיק מתורגמנים ומתורגמניות הזמינים להנגשת שפת סימנים באופן יומיומי ובזמן אמת. "חשוב לזכור שעלות ההפקה והאופרציה של תרגום תוכן לשפת סימנים כרוכה בעלויות גבוהות מאוד, שמורידות את הכדאיות של זה. בארצות הברית למשל, עלות התרגום של תוכן קיים לשפת סימנים עומדת על כ-40 אלף שקלים לשעה מצולמת בסטודיו. זה הופך את מיזמי התרגום ללא כדאיים, וכאן אנחנו נכנסים לתמונה עם האווטאר", הוא מסביר. "המטרה שלנו בסופו של דבר היא לשמש כסטנדרט בהנגשה לשפת הסימנים על ידי בינה מלאכותית. הייחודיות שלנו מתבטאת בכך שבכמה שורות קוד בודדות, אנחנו יכולים להפוך כל תוכן לשפת סימנים בזמן אמת".
בין היתר, התרגומים שבהם עוסקת החברה כיום כוללים תכנים כמו קורסים דיגיטליים, סרטוני YouTube, שיחות וידאו ב-Zoom, סרטונים של בנקים, של סניפי דואר ושדות תעופה, וכן גם של משחקי מחשב ואפליקציות. "החזון שלנו הוא להאזין לעולם ולתרגם אותו לשפת הסימנים", מסכם מגד, "בפשטות, אנחנו סירי או אלקסה של אוכלוסיית כבדי השמיעה והחירשים".
רגע לפני הפריצה, בחזרה להתחלה
בתחילת דרכו של הסטארטאפ, נרשמו לא מעט קשיים ואתגרים שעימם נאלצה החברה להתמודד. תוכנית האקסלרטור 8200 אימפקט של עמותת בוגרי 8200 הייתה שם למענם וסייעה למיזם כבר בשלביו הראשונים. "חיפשנו ליווי והדרכה כסטארטאפ מתחיל, ושמענו ש-8200 אימפקט היא תוכנית ייחודית המשלבת טכנולוגיות מורכבות לצד אימפקט חברתי", מספר מגד, "לכן הרגשנו שהתוכנית מתאימה לנו כמו כפפה ליד, ואכן הייתה לה תרומה גדולה עבורנו. התוכנית הפגישה אותנו עם מנטורים מובלים מהתעשייה, עם שותפים ועם חברות של התוכנית, לצד משקיעים".
ליהיא פרידמן, מנהלת התוכנית מספרת: "בצל ריבוי האתגרים שזימנה המלחמה, לצד אי היציבות בשוק, החלטנו לרענן ולהתאים את המודל של האקסלרטור ולהתמקד לראשונה בליווי ואקסלרציה שיאפשרו לסטרטאפים לצלוח את התקופה הקריטית הזו, ולמקסם את הערך שיקבלו מאיתנו. הושם דגש על הקניית כלים לפיתוח חוסן רגשי ומנטלי החיוניים במסע היזמי תמיד, וביתר שאת בעת מלחמה. זו זכות גדולה ללוות חברות ישראליות פורצות דרך, שגם תחת אש מפתחות פתרונות טכנולוגיים שיהפכו את העולם לטוב יותר".