Open AI הכריזה על DALL-E 3, דור חדש למחולל התמונות המבוסס על בינה מלאכותית. ב-Open AI טוענים לשורה ארוכה של שיפורים משמעותיים שהופכים את DALL-E 3 למודל המתקדם מסוגו נכון להיום.
לפי Open AI, המודל של DALL-E 3 הוא הראשון שמסוגל ליצור תמונות בהן מופיע טקסט קריא. המודל החדש מתמודד היטב גם עם ציור של תווי פנים אנושיים ואצבעות ידיים – פרטים נוספים שבהם מחוללי תמונות מבוססי בינה מלאכותית התקשו עד כה.
בעוד שבעבר נדרשו המשתמשים לנסח משפטים מורכבים ומסורבלים על מנת להגיע לתוצאות ראויות, הרי ש-DALL-E 3 אמור להבין גם הוראות באנגלית פשוטה, ולספק תוצאות מצוינות גם לפי תיאור שאיננו מפורט – תוך שהמודל מצליח לפרש נכונה את כוונת המשתמש. בנוסף, DALL-E 3 ישולב באופן ישיר בתוך ChatGPT. זה אומר ש-ChatGPT יוכל גם הוא לעזור בניסוח הוראות לציור, ולהציע תיקונים שונים בזמן אמת.
ב-Open AI טוענים גם כי הם נותרים מחויבים גם לפתרונות בנושא בטיחות וזכויות יוצרים. DALL-E 3 ידע לסרב לבקשות לציור של אנשים מפורסמים, סצינות אלימות או פוגעניות. הוא גם יסרב לצייר ציורים בסגנון האופייני לאמנים שעדיין חיים. החברה עובדת גם על מערכת שתאפשר לזהות במהירות תמונות שנוצרו על ידי בינה מלאכותית.
הראשונים שיזכו להתנסות ב-DALL-E 3 יהיו מנויי הפרימיום לשירות ChatGPT Plus, שיזכו לגישה למחולל התמונות החדש במהלך החודש הבא. בשלב זה לא ברור מתי תפתח OpenAI את DALL-E 3 לכלל המשתמשים.
עדכון: מיקרוסופט (Microsoft) הכריזה כי DALL-E 3 יגיע בקרוב לצ׳אט הבינה המלאכותית של מנוע החיפוש בינג (Bing), על כל השדרוגים והשיפורים שהוזכרו בהכרזה המקורית של Open AI. משמעות הדבר: משתמשים שיהיו מעוניינים להתנסות במודל החדש, יוכלו לעשות זאת דרך בינג ובחינם, במקום להמתין להשקה רחבה יותר של Open AI עצמה.
רעיון מעולה