ג'מיני 2.0 (צילום: google)
ג'מיני 2.0 | צילום: google
גוגל הכריזה אתמול על Gemini 2.0, ג'מיני 2.0, מודל הבינה המלאכותית החדש שלה. המודל החדש נועד להניע את  מה שבגוגל מכנים "עידן הסוכן" (Agent), שבו בינה מלאכותית תוכל להבין את העולם סביבנו, לחשוב קדימה, להרכיב בעצמה את שורת המשימות הנדרשות על מנת להגיע למטרה ולפעול בשמנו בצורה יעילה.

המודל החדש ישולב בכלל מוצרי גוגל, החל ממנוע החיפוש ועד לאפליקציות כמו ג'ימייל ודוקס. פיצ'ר "AI Overviews" במנוע החיפוש, שכבר זמין למיליארד משתמשים, ישודרג ביכולות ההסקה המתקדמות של Gemini 2.0, ויאפשר למשתמשים לשאול שאלות מורכבות יותר ולקבל תשובות מפורטות ומדויקות יותר.

עיקר ההתמקדות בהכרזה של גוגל הייתה בסוכנים, שיושקו בינואר. הסוכן AI, המופעל על ידי Gemini, משתלט על דפדפן Chrome שלכם, מזיז את הסמן על המסך, לוחץ על כפתורים וממלא טפסים, מה שמאפשר לו להשתמש ולנווט באתרים ממש כמו בן אדם.

בנוסף, הסוכן יכול לקרוא את מה שהמשתמש עושים, כך שלפי גוגל, אותו סוכן יוכל לתת למשתמשים עצות בזמן שהם משחקים במשחק. המשמעות היא שה-AI יוכל לראות את המשחק, ללמוד את הכללים שלו ולהבין תוך כדי כיצד ניתן לנצח באותו משחק. הסוכן יוכל גם לערוך את רשימת הקניות של המשתמשים עבורם באתר הקניות לבחירתם, אך לפי גוגל הסוכן יעצור כאשר העגלה תהיה מלאה ולפני הרכישה עצמה.

החברה מתחילה בהשקת סוכן הבינה המלאכותית שלה לקבוצה קטנה של בודקים שנבחרו מראש ביום רביעי, כך אומרת גוגל. גוגל ממשיכה להתנסות בדרכים חדשות עבור ג'מיני לקרוא, לסכם ועכשיו גם להשתמש באתרים.

אחד הסוכנים שהציגה גוגל היא פרויקט לו היא קראה "אסטרה". מדובר בסוכן שיכול לנהל שיחות מורכבות במספר שפות, תוך גישה לכלים של גוגל ושמירה על זיכרון הקשרי של אינטראקציות קודמות. בהדגמה של גוגל, היא הראתה כיצד הסוכן ידע לקרוא פתק על בגד המראה את סימני הכביסה השונים, ולפי זה לכוון את המשתמש על איזו תוכנית עליו להשתמש במכונת הכביסה שלו, כשאת כל המידע קיבל הסוכן ממצלמת הטלפון של המשתמש.

במקביל גוגל חשפה גם את Gemini 2.0 Flash, המודל הרזה יותר של גוגל. Flash מתאפיין בזמן אחזור נמוך וביצועים משופרים, והוא נועד לעבודה בהיקף נרחב, בנוסף לניתוח ועיבוד ממקורות שונים. Flash מסוגל גם ליצור תוכן מקורי, כמו תמונות הכוללות טקסט ואודיו במגוון שפות.

ההכרזה של גוגל מחממת עוד את מלחמת ה-AI, כששבוע שעבר OpenAI הכריזה על מודל מיוחד לבעלי מקצוע כמו רופאים או מתמטיקאים, שיוכל להיות מומחה בתחום ספציפי. בנוסף, OpenAI השיקה את הגרסה החדשה שלה ל-Sora, מודל בינה מלאכותית שיכול לייצר סרטוני וידיאו של עשר שניות מבקשת טקסט.