צוות מומחי AI מובילים מענקית הייעוץ הטכנולוגית Accenture חברו כדי לייצר בהתנדבות פתרון מבוסס בינה מלאכותית (AI) עבור ארכיון מכון ארולסן בגרמניה, המסייע לחלץ מידע אודות קורבנות רדיפות הנאצים ממסמכי הארכיון במהירות של פי 40 ממה שהיה עד היום.
ארכיון ארולסן משמר את האוסף הגדול בעולם של מסמכים המתעדים את רדיפות הנאצים - מעל 110 מיליון מסמכים וחפצים דיגיטליים, שחלקם משתייכים לתוכנית "זיכרון העולם" של אונסק"ו, יוזמה בינלאומית אשר מטרתה לשמור על המורשת התיעודית של האנושות כנגד השמדה. חלק מהותי בעבודת הארכיון הוא להנגיש את המסמכים הללו לכל המבקשים לחפש מה עלה בגורלם של קורבנות וניצולי שואה.
עם תום מלחמת העולם השנייה, בעלות הברית הקימו שירות איתור בינלאומי לנפגעי הנאצים בעיירה באד ארולסן שבגרמניה. במרוצת השנים שירות האיתור הפך למכון מחקר שנושא את שם העיירה "ארולסן", ועיקר פעילותו מתמקדת בתיעוד פשעי הנאצים באמצעות ארכיון עצום, כולל מסמכים על מחנות ריכוז, עבודת כפייה ועקורים.
במאמץ להפוך את חיפוש המידע לנגיש ככול האפשר, החלו בארולסן לפני מספר שנים בתהליך דיגיטציה של כל המסמכים ופרסומם באופן מקוון כחלק מפרויקט #everynamecounts. היות ומדובר במסמכים ישנים, שחלקם הועלו באופן שאינו בר חיפוש (למשל כתמונה) וחלקם נפגמו, הרי שנדרשת עין אנושית לטובת תרגום, קריאה, תמלול, קטלוג ואימות של מסמכים אלה, מה שעשוי להימשך עשרות שנים. כל מסמך מתווסף באופן עצמאי על ידי שלושה מתנדבים, ואם הערכים שהוכנסו אינם תואמים במדויק, הרי שהם נבדקו על ידי עובד ארכיון Arolsen שהכריע בעניין. למעשה נדרשו עד היום בממוצע ארבע אנשים כדי לאנדקס במדוייק ארבעה מסמכים במהלך שעה אחת.
איאן לוור, מתנדב Accenture ופעיל בקבוצת העובדים היהודית בחברה (באקסנצ'ר מועסקים למעלה מ-670 אלף עובדים ועובדות ברחבי העולם), הבין במהירות שבינה מלאכותית יכולה להאיץ את התהליך הזה באופן משמעותי. לוור הצליח לרתום מתנדבים אחרים ב- Accenture ותוך 10 שבועות הקבוצה הצליחה ליצור פתרון AI ייעודי לאינדוקס מסמכי מכון ארולסן.
המתנדבים עבדו עם צוותי המומחים של קבוצת ה- AI.Solutions של Accenture והצליחו להשמיש פתרון קיים של Accenture AI, העושה שימוש בזיהוי תווים אופטי וטכנולוגיית מתקדמות אחרות המאפשרות לחלץ מידע ממסמכים שקריאתם קשה במיוחד גם עבור העין האנושית. אלו כוללים רשומות של אסירים ועצורים המכילים עשרות שורות, כמו גם רישומי מחנות ריכוז ומסמכים מנהלתיים נוספים של השלטון הנאצי המכילים מידע אודות מיקומם וגורלם של משפחות שלמות.
מכיוון שה-AI לוכד את המידע מהר יותר ומגביר את הדיוק שלו ככול שהתהליך נמשך הרי שארבעה מתנדבים יכולים כעת לאמת כ-160 מסמכים בשעה אחת - הכפלה של פי 40 בהספק. מאז הטמיעה Accenture את הפתרון בדצמבר 2021, נוספו לאינדקס של מכון ארולסן יותר מ-160,000 שמות של קורבנות רדיפות הנאצים, חולץ מידע מיותר מ-18,000 מסמכים, ואוגדו יותר מ-60,000 מסמכים לקבוצות דומות כדי לשפר את הזיהוי והניתוח. כ-1,000 אנשי Accenture התנדבו לפרויקט עד היום, כאשר Accenture תומכת גם בתחזוקה ובפיתוח נוסף של פתרון הבינה המלאכותית.
למרות שהבינה המלאכותית עושה את מרבית העבודה, הפיקוח האנושי חיוני לתהליך, לא רק כדי להבטיח דיוק, אלא גם כדי לבצע למידה אודות תפקוד הבינה המלאכותית. על ידי עיון ותיקון מידע, מתנדבים "מלמדים" את הפתרון לזהות תווים וקיצורים בכתב יד שהיו אופייניים לתקופה. הודות למאמץ האנושי עד כה, הבינה המלאכותית שיפרה בהדרגה את הדיוק שלה ב-10% ופועלת כעת ברמה של 99% הצלחה.
כך, לדוגמה, מקס פורמאנוב, מנהל חטיבת הענן של אקסנצ'ר, זרוע מיוחדת שמעסיקה 70,000 מומחי ענן ברחבי העולם, מצא במסגרת הפרויקט מה עלה בגורל קרובי משפחתה של אמו, במקור מבלארוס.
"אנו גאים במאמצים של העובדים שלנו לעזור ולשמר את זכרם של מי שעברו תלאות וסבל בלתי נתפסים, במיוחד בתקופה ובה אנטישמיות, גזענות ולאומנות קיצונית שוב זוקפים את ראשן המכוער", אמר דיוויד מטניק, מנהל תחום החינוך והמגזר הציבורי באקסנצ'ר, ארה"ב, ומי שלקח את הפרויקט תחת חסותו. "ראינו בעיה, אשר מגלמת בתוכה הזדמנות לממש את הערכים שלנו כחברה וכבני אדם ולרתום את הטכנולוגיה שלנו לטובת הכלל".