התחרות על ליבת הבינה המלאכותית בעיצומה: אינטל (Intel) הכריזה היום (ג’) על שבב הבינה המלאכותית החדש שלה הנקרא Gaudi 3. הוא נועד להוות פתרון עבור ענקיות המחשוב שיאפשר לאמן לפרוס מודלים בינה מלאכותית גדולים, כגון זה שעומד בבסיס ChatGPT של OpenAI.
אינטל טוענת ששבב Gaudi 3 חסכוני פי שניים בחשמל ויכול להפעיל מודלים של בינה מלאכותית במהירות גבוהה יותר בהשוואה ל-Nvidia. הוא מגיע גם בתצורות שונות כמו חבילה של שמונה שבבי Gaudi 3 על לוח אם אחד או כרטיס עצמאי (PCIe) שיכול להיכנס למערכות קיימות החוסך את הצורך בחומרה חדשה.
בהשוואה ל-Nvidia H100, ה-Gaudi 3 צפוי לספק בממוצע אימון מהיר יותר ב-50% על מגוון מודלי השפה המתקדמת, תפוקת הפקה (inference) גבוהה ב-50% וחיסכון באנרגיה של 40% על גבי מודלי שפה שונים, לצד יתרון ביצועים בעיבוד משפטים ארוכים יותר. Gaudi 3 מתהדר בהפקה מהירה יותר בכ-30% על מודלים מובילים כמו Llama ו-Falcon.
אנחנו מצפים שהוא יהיה תחרותי מאוד” מול השבבים האחרונים של Nvidia, אמר דאס קמהות’, סגן נשיא תוכנת Xeon באינטל. “מהתמחור התחרותי שלנו, הרשת המשולבת הפתוחה והייחודית שלנו על השבב, אנחנו משתמשים ב-Ethernet סטנדרטי בתעשייה. אנחנו מאמינים שמדובר בהצעה חזקה.”
אינטל ציינה שהשבבים החדשים מסדרת גאודי 3 יהיו זמינים ללקוחות ברבעון השלישי, וחברות כמו Dell, HP ו-Supermicro צפויות להציג פתרונות חדשים עם השבבים. המעבד החדש צפוי להיות זמין ליצרני המחשבים כבר ברבעון השני של 2024, עם השקה רחבה יותר ברבעון שלאחר מכן.
Nvidia שולטת כיום בכ-80% משוק שבבי הבינה המלאכותית עם מעבדי הגרפיקה שלה, לא הצרכנים אלא הארגוניים מסדרות Tesla. אלה נחשבים לבחירה המועדפת עבור חברות הבונות מודלי בינה מלאכותית, שכן גם לא קיימים הרבה אלטרנטיבות בשוק, לפחות לא עד עכשיו. עם זאת, גם Nvidia מכינה את הדור הבא שלה, B100 ו-B200, שהם ממשיכים את H100 ומבטיחים גם הם שיפור בביצועים.