חברת OpenAI, המפתחת של ChatGPT, הציגה כלי AI חדש שיכול לשנות את המשחק פעם נוספת. הטכנולוגיה החדשה, שנקראה "סורה", יכולה לקחת כל טקסט שהמשתמש כותב ולהפוך אותו לסרטון וידיאו פוטוריאליסטי של כמה שניות.
כמה חברות עובדות על כלים שיאפשרו למשתמשים לייצר בלחיצת כפתור סרטוני וידאו, אבל סורה של OpenAI, מההדגמות שהחברה הציגה, היא הכלי המתקדם ביותר בתחום. החברה הציגה כמה דוגמות של הטכנולוגיה. לפי הודעת החברה, המודל החדש מסוגל לייצר סצנות מורכבות עם כמה דמויות, ואף ניתן לבקש ממנו תנועת מצלמה ספציפית ולתאר לפרטי פרטים את הרקע המבוקש לסרטון. "המודל מבין כיצד אובייקטים נעים בעולם הפיזי" נכתב בהודעה.
כאן למשל נכתב לסורה "טוקיו יפה ומושלגת, ומלאה אדם. המצלמה נעה דרך הרחובות ההומים, עוקבת אחרי אנשים שנהנים ממזג האוויר המושלג והיפה וקונים מוצרים בדוכנים הקרובים. עלי פריחת הדובדבנים עפים ברוח בין פתיתי השלג".
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
המודל החדש של OpenAI מסוגל לייצר סרטוני וידיאו מתמונת סטילס בודדת, או להאריך סרטונים קיימים בכמה שניות נוספות לפי המידע שנמצא בתוך הסרטון עצמו.
המודל החדש עדיין לא פתוח לציבור הרחב, אלא למספר מצומצם של חוקרים, מעצבים ואנשי קולנוע. בחברה לא מסרו מתי הם מתכננים לשחרר את המודל הזה לציבור הרחב, אם בכלל, וזאת בשל כוח המחשוב האדיר שהטכנולוגיה הזאת דורשת. בחברה מסרו גם כי אנשי "הצוות האדום", שאחראים לבדיקת בטיחות הטכנולוגיה, מתנסים במודל החדש ללמוד את הסכנות שהוא יכול להוות אם ישתחרר לציבור.
Announcing Sora — our model which creates minute-long videos from a text prompt: https://t.co/SZ3OxPnxwz pic.twitter.com/0kzXTqK9bG
— Greg Brockman (@gdb) February 15, 2024
כמה חברות שחררו מודלים ליצירת סרטוני וידיאו מטקסט של משתמשים, אך אף אחת לא מתקרבת לרמה שהציגו הלילה OpenAI, לא באיכות הסרטונים שהוצגו ולא באורך שלהם. מדובר בקפיצת מדרגה של ממש עבור OpenAI ועבור כלי Gen AI באופן כללי.
Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024