בחודש אוגוסט האחרון עורר בחור אמריקאי, תושב קולורדו, ויכוח רב עצמה בעולם האמנות לאחר שזכה במקום הראשון בקטגוריית אמנות דיגיטלית בתחרות האמנויות של מדינת קולורדו. היצירה שהגיש ג'ייסון מ' אלן, 39, בשם "תיאטרון אופרה בחלל" (Theatre D’opera Spatial בצרפתית) נוצרה באמצעות מחולל התמונות של Midjourney, מערכת בינה מלאכותית שממירה טקסט לתמונה, וזו זיכתה אותו בפרס כספי העומד על 300 אלף דולר.

בחודשים האחרונים הפכו מחוללי תמונות מבוססי AI לנושא החם, לא רק בקרב חובבי הטכנולוגיה והגיימינג, אלא גם בקרב מעצבים, יוצרי תוכן, תסריטאים ועוד. מחוללי תמונות (AI art generators) הם מערכות טכנולוגיות מבוססות בינה מלאכותית שמאפשרות באמצעות כתיבת טקסט בלבד, להפוך רעיונות לגרפיקה חזותית.

אחד האתגרים העיקריים של משתמשים במערכות הללו הוא להגיע לתוצאות מרשימות התואמות את הטקסט שהוזן למערכת.

מריה רייבסקי, מנהלת שותפויות בחברת טקטונה, חברת הטכנולוגיה העומדת מאחורי Bored.Ai, פלטפורמה המאפשרת ליצור יצירות אמנות באמצעות טקסט המוזן על ידי משתמשים תוך שימוש במערכת AI, מסבירה כיצד "לדבר" אל המערכת בשפה המדויקת שלה ולהגיע לתוצאות טובות ככל האפשר.

איך "חושבת" המערכת של מחולל תמונות

המערכת נדרשת להשוות בין הטקסט שהוזן לבין תיאורים ומרכיבים מילוליים וויזואליים, שאותם היא למדה בעבר. לשם כך, ממפה המערכת את התיאור המילולי במרחב ויזואלי. לאחר מכן עובר המיפוי הויזואלי תהליך שמטרתו להוסיף פרטים ו"רעש" דיגיטלי לתמונה, המולבשים על גבי הויזואליות שאותרו במיפוי הראשוני. תהליך זה נעשה בשימוש מודלים הסתברותיים מורכבים, שמסוגלים להביא ליצירות מגוונות ומקוריות. לבסוף, בעזרת ידע קודם שלמדה המערכת, נבדקת התוצאה שהתקבלה לסמנטיקה של התיאור המילולי שהזין השתמש. 

הנחיות או לא להיות

הנחיות הן טקסט המתאר בשפה טבעית את הרעיון של המשתמש. ההנחיות ליצירה צריכות לכלול שני מרכיבים עיקריים: תוכן - מה שהמשתמש רוצה לראות; תיאור - איך זה צריך להיראות. ככל שהמשתמש יכתוב תיאור מפורט ומדויק יותר, שיכלול כמה שיותר פרטים בהנחיה - התוצאה שתתקבל תהיה מתוחכמת יותר ודומה יותר לכוונתו המקורית. הנחיה מעורפלת או כללית מדי גורמת לפלט כאוטי שיכול לעיתים להיות חסר פירוט ואלמנטים עיצוביים. על ידי התייחסות למאפיינים שלהלן, כל אחד יכול ליצור בקלות הנחיות מפורטות שיגדילו את הסיכוי לקבל תוצאה מצוינת:

  • דמויות, חפצים ועצמים
  • שמות תואר המתארים את הדמויות, החפצים והעצמים
  • זרם אמנותי (למשל: אימפרסיוניזם, רנסאנס, סוריאליזם וכדומה)
  • שמות של אמנים ויוצרים בעלי קו אומנותי מובחן (למשל: ואן גוך, אנסל אדאמס)
  • סִגְנוֹן ויזואלי (למשל: פופ-ארט, ציור שמן, פנטזיה וכדומה)
  • איכות (למשל: רזולוציה גבוהה/נמוכה, מפוקסל, 4K וכדומה)
  • יַחַס (למשל: פורטרט, תמונה אופקית, תמונה מרובעת וכדומה)

כיצד מתחברים לפלטפורמת Bored.Ai?

דיסקורד (באנגלית: Discord) הוא יישום ואתר אינטרנט חינמי, המיועד לקהילות בתחומי עניין שונים ומאפשר למשתמשים בו לתקשר עם משתמשים אחרים באמצעות התכתבויות, שיחות וידאו ושיחות שמע. השימוש העיקרי בדיסקורד הוא תקשורת ציבורית בשרתים, אשר מהווים סוג של קבוצות שמחולקות לנושאים שונים וקהילות שיכולות להיות קטנות או גדולות מאוד. ל-Bored.Ai ישנה קהילה שוקקת בשרת דיסקורד ייעודי ובו עשרות אלפי משתמשים מכל העולם אליה ניתן להתחבר בקלות ובחינם. 

אז איך זה עובד? 

צרו חשבון דיסקורד - ניתן לעשות זאת בדף הבית שלהם.

הצטרפו לשרת Bored.Ai באמצעות הקישור הזה.

ברגע שהתחברתם לשרת, ולאחר קבלת כללי השרת, משתמשים יכולים לקבל קרדיטים בשתי דרכים עיקריות:

1. השתתפות באתגרים ומשחקים יומיים (יצירת תמונות בנושאים שונים ומוגדרים מראש)

2. שיתוף היצירות במדיה החברתית של המשתמשים - אינסטגרם וטוויטר.

זכייה באתגרים ובמשחקים היומיים ושיתוף היצירות מעניקות למשתמשים קרדיטים (נקודות) שמשמשים את המשתמשים כדי להמשיך וליצור יצירות בחינם על-גבי הפלטפורמה. 

הבסיס: Prompt ,Sculpt ,Polish

תהליך היצירה מתחיל ב"הנחיה" למערכת (Prompt) - טקסט המוזן בתיבת צ'אט עם הפקודה go! לפניו. תוך מספר שניות, מחולל התמונות מנסח מחדש את תיאור הטקסט הראשוני ומציע מספר אפשרויות של "הנחיות" משודרגות, מפורטות ומורכבות יותר. לאחר בחירת הטקסט הרצוי, בין אם הטקסט המקורי שהוזן או אחת ההנחיות המשודרגות, מציגה המערכת למשתמשים ארבע תמונות ראשוניות שמהן יפתחו את יצירותיהם. קבוצת תמונות ראשונית זו היא בעצם סקיצה ליצירה הסופית. 

השלב הבא הוא הפקודה "Sculpt" שאחראית לעצב את התמונה לאחר עיבוד וחשיבה מחודשת. הפקודה sculpt ומציגה בפני המשתמשים מספר וריאציות נוספות של התמונה שנבחרה. לאחר מכן, ניתן להשתמש בפקודה "Polish" בכדי לשדרג את התמונה פעם נוספת ולהציג פרטים בצורה חדה יותר. 

לאחר שעברה שדרוג "פוליש" והפרטים בה חדים יותר, פקודה זו תציג גם כן כמה גרסאות של התמונה כדי לבחור את הטובה ביותר ולקבל את הפלט היחיד הסופי. לאחר מכן, המשתמשים יכולים להסיר את סימן המים של Bored.Ai ולהוריד יצירה ברזולוציה גבוהה של 4k. אפשר לגלגל מחדש כל שלב בתהליך היצירה כדי לקבל יותר אפשרויות, ובכל פעם תמונות יהיו ייחודיות.

עם המחולל של Bored.Ai, למשתמש יש גם אפשרות לשנות תמונה קיימת על ידי העלאת תמונות על ידי המשתמש ואז להתחיל באותו תהליך.

 איך זה נראה בפועל?

הנחיה מקורית: דיוקן של גבר נאה שהוא מעצב ומנהל קריאייטיב. עיניים נוקבות, חכמות וחכמות, מרכיבות משקפיים. PFP, צילום, היפר ריאליסטי, תחנת אמנות

ההנחיה הנבחרת לאחר שדרוג ההנחיה על ידי המערכת: דיוקן של גבר נאה עם עיניים נוקבות, חכמות ומתוחכמות. הוא מרכיב משקפיים ומביט למרחק. PFP, photo, hyper realistic, art-station. דיוקן של גבר חתיך שהוא מעצב ומנהל קריאייטיב. 

ההצעה הראשונה של המערכת: נבחר לפקודת SCULP את תמונה מספר 1.
לאחר שבחרנו את תמונה מספר 1 קיבלנו את ארבע ההצעות הללו. מתוכן נבחר להמשיך עם תמונה מספר 3 לפקודת Polish.

לאחר שלוש פקודות קיבלנו את היצירה הזו. מכאן אם נרצה לשנות ולשפר נוכל להמשיך לתת פקודות למערכת שתמשיך להציע גרסאות שונות ליצירה.

יצירה בסגנון פנטזיה במחולל התמונות של Bored AI של המשתמש @Siradipity

הנחיה מקורית וסופית: קונספט ארט דמות מאת מאייר במשחקי התפרעות!! מאת ארטגרם, גרג רוטקובסקי ואלפונס מוקה. מִסתוֹרִי, תנוחת T, גוף מלא, דיוקן ברור של גבר מושך בודד בשריון כבד, נשק פנטזיה, אפקט אור. מאוד מפורט, אורות זוהרים, ציור מורכב, אלגנטי, דיגיטלי, אמנות, מיקוד חלק, חד.

מתוך ארבע היצירות המוצעות על ידי המערכת נבחר להמשיך לפקודת Sculp עם יצירה מספר 2. 

נבחר להמשיך עם יצירה מספר 4 לפקודת Polish ונקבל את היצירה הסופית:

 

עיצוב אופנה במחולל התמונות של Bored AI של המשתמש @Rhinoboy1972

הנחיה מקורית: צילום מוצר תלת-ממד של אוקטן מפוסל קונספטואלי של VFX עיצוב סנדל קצף קרוקס לגברים עם מגף צבאי טקטי בסגנון Crocs Octane Render 3D

ההנחיה הנבחרת לאחר שדרוג ההנחיה על ידי המערכת: עיבוד תלת מימדי של עיצוב קונספטואלי לסנדל לגברים המהווה הכלאה בין קרוקס למגף צבאי, Octane Render 3D. צילום מוצר של Octane Render 3D VFX מפוסל קונספטואלי סנדל סנדל קרוקס קצף לגברים בשילוב טקטי מגף צבאי בסגנון Crocs Octane Render 3D

מתוך ארבע היצירות המוצעות ע"י המערכת נבחרת להמשיך עם יצירה מספר 1 לפקודת
Sculp.

נבחר להמשיך עם יצירה מספר 1 לפקודת Polish ונקבל את התוצאה הסופית: 

יצירה אדריכלית במערכת Bored AI של המשתמש: @sophiag11

אחד הייעודים של מחוללי התמונות הוא להיות כלי שימושי ביותר עבור מעצבים מסוגים שונים – אדריכלים, מעצבי אופנה, מעצבים תעשייתיים ועוד. בשרשור הבא נציג את היכולות של מחולל התמונות ככלי עזר עבור אדריכלים.

הנחיה מקורית: ביתן אדריכלי שיש לו שישה קירות מעוגלים מנותקים זה מזה אך ממוקמים על אותו מישור

ההנחיה הנבחרת לאחר שדרוג ההנחיה על ידי המערכת: ביתן עם שישה קירות מנותקים זה מזה, אך מונחים על אותו המישור, שרטוט. 

מערכת ה AI מציעה על בסיס ההנחיה את ארבע היצירות הללו. נבחר לפקודת Scuplt עם יצירה מספר 4.

נמשיך עם יצירה מספר 4 לפקודת Polish ונקבל את התוצאה הסופית: 

>> המדריך המלא: כך תייצרו את התמונות המושלמות ב-Dall-E 2