הימים האחרונים היו עמוסים במיוחד בהתפתחויות משמעותיות בתחום הבינה המלאכותית, עם הכרזות מחברות טכנולוגיה מובילות כמו גוגל, מיקרוסופט, OpenAI ו-Character.AI. בגלל שקשה לעמוד בקצב של אותן חברות, הנה סיכום שמתמצת את החדשות המרכזיות:​

OpenAI משיקה יצירת תמונות ב-ChatGPT באמצעות GPT-4o

OpenAI, המתחרה הגדולה של גוגל, הציגה תוספת ליכולות יצירת תמונות בתוך ChatGPT וגם בסורה באמצעות מודל GPT-4o. החידוש הוא האפשרות לעריכת תמונות בעזרת תמונות ולא רק טקסט כפי שהיה עד כה. התכונה זמינה לכל המשתמשים, אך בגלל עומס תעבוד תחילה רק למנויי הפרו היקר או הפלוס, ובעתיד תהיה פתוחה לכולם בחינם. מודל GPT-4o, עם יכולת הפקת תמונות, "חושב" מעט יותר זמן בהשוואה למודל שהוא מחליף - DALL-E 3, אך מספק תמונות מדויקות ומפורטות יותר לפי OpenAI. בנוסף, GPT-4o מסוגל לערוך תמונות קיימות, כולל כאלה המכילות אנשים, ולבצע "inpainting" – תיקון ושינוי פרטים כמו אובייקטים ברקע ובחזית. 

עם השקת הפיצ'ר החדש, הרשתות החברתיות התמלאו בתמונות שנוצרו בידי GPT. גם סם אלטמן, מנכ"ל OpenAI הודה שנדהם מההצלחה: "תמונות ב-chatgpt הרבה יותר פופולריות ממה שציפינו (והיו לנו ציפיות די גבוהות). למרבה הצער, ההשקה לפלטפורמה החינמית שלנו תתעכב לזמן מה".

בהמשך הוסיף אלטמן ציוץ נוסף בו כתב: "זה כיף ענק לראות שאנשים אוהבים ליצור תמונות בצ'אט GPT, אבל השרתים שלנו קורסים. לכן באופן זמני נטיל הגבלת שימוש כדי להפוך את השירות ליעיל יותר, בתקווה שזה לא יימשך הרבה זמן. כל משתמש יוכל לייצר שלוש תמונות ביום".

 

 

שרשור תמונות שנוצרו בידי GPT וזכה למיליוני צפיות:

אחד הדברים שהכי הלהיבו את הגולשים הוא האפשרות ליצור תמונות אנימה מתמונות רגילות. למשל, רגעים ותמונות אייקונים מההיסטוריה של ישראל.

איך ייראו סרטים ישראלים מפורסמים בסגנון אנימה?

וגם יודע ליצור צילומי מסך של עמודי ויקיפדיה

וגם ארץ נהדרת הצטרפה

גוגל מציגה את Gemini 2.5 Pro עם יכולות הסקת מסקנות מתקדמות

גוגל השיקה השבוע את דגם הבינה המלאכותית החדש שלה, Gemini 2.5 Pro, המציע שיפורים משמעותיים בביצועים בהשוואה לדגמים קודמים. הדגם מתמקד ביכולות הסקת מסקנות, ומסוגל להתמודד עם משימות מורכבות בשלבים מרובים. הוא מציג ביצועים מובילים במבחני AI סטנדרטיים, ועולה על מתחרים כמו OpenAI ו-Anthropic בהסקת מסקנות, תכנות, מתמטיקה ועוד - כך על פי גוגל. הדגם זמין ב-Google AI Studio ולמנויי Gemini Advanced באפליקציית ג'מיני. ​

תכונות וידאו בזמן אמת מגיעות ל-Gemini Live

בנוסף, גוגל מרחיבה את יכולות Gemini Live, אפשרות שיחת לייב עם הצ'אטבוט, עם תכונות AI חדשות המאפשרות אינטראקציה בזמן אמת עם מסך המכשיר או מצלמת הסמארטפון. המשתמשים יכולים כעת לקבל תשובות מבוססות על התוכן המוצג על המסך או דרך הווידאו החי מהמצלמה. תכונות אלו זמינות למנויי Gemini Advanced במסגרת תוכנית Google One AI Premium.

A short demo of Project Astra (Share screen with Live)
byu/Kien_PS inBard

גוגל מציגה את Gemini Flash 2 עם יכולות יצירת תמונות

דגם ה-Gemini Flash 2 החדש של גוגל מתמקד ביצירת תמונות ברמה גבוהה ומציע אינטגרציה טבעית יותר עם אפליקציות צד שלישי. בנוסף לאפשרות ליצירת תמונות מפרומפט, ניתן גם לערוך תמונות בעזרת הפיצ'ר הזה - מה שמדאיג חלק מהגולשים היא האפשרות למחיקה בקלות של הטבעות מים, Water Mark, ששמים על תמונות כדי לשמור על זכויות השימוש בהן. על פי חלק מהאנשים שניסו את התכונה החדשה מדובר ב"פיצ'ר שיהרוג את פוטושופ". 

Gemini is pretty good in removing watermarks
byu/xXLeoXxOne insingularity

 

מיקרוסופט מוסיפה סוכני AI להסקת מסקנות ב-Microsoft 365 Copilot

מיקרוסופט הכריזה על הוספת שני סוכני AI חדשים, Researcher ו-Analyst, לכלי Microsoft 365 Copilot. ה-Researcher משתמש במודל של OpenAI לביצוע מחקרים מורכבים ומשלב נתונים ממקורות צד שלישי כמו Salesforce ו-ServiceNow. ואילו ה-Analyst מבוסס על מודל o3-mini ומסוגל לעבד נתונים גולמיים, להריץ קוד Python ולהפיק דוחות מפורטים, בדומה למהנדס נתונים מיומן. התכונות יהיו זמינות למנויי Microsoft 365 Copilot החל מאפריל במסגרת תוכנית בטא.

Character.AI מציגה דוחות להורים על פעילות הצ'אט של בני נוער

Character.AI, אשר הסתבכה בעבר לא מעט עם צ'אטבוטים שגרמו לילדים להתאבד, השיקה את "Parental Insights", תכונה המאפשרת לבני נוער לשלוח דוח שבועי להוריהם על פעילות הצ'אטבוט שלהם. הדוח כולל זמן שימוש יומי ממוצע, הדמויות שאיתן התקיימה האינטראקציה וזמן השיחה עם כל אחת מהן. התכונה היא אופציונלית ואינה משתפת את תוכן השיחות, במטרה להתמודד עם חששות לגבי שימוש יתר ותוכן לא הולם.