מטא (Meta) הציגה את AudioCraft – בינה מלאכותית ליצירת קטעי מוזיקה ואודיו המורכבת משלושה מודלים שונים: MusicGen – מודל הזמין לשימוש ציבורי המייצר מוזיקה לפי הנחיות טקסט, ואומן עם מוזיקה בבעלות Meta וברישיון ספציפי; AudioGen – מודל המייצר קטעי אודיו על בסיס הנחיות טקסט ו-EnCodec, מפענח המאפשר ליצור ולדחוס מוזיקה באיכות גבוהה ביעילות.
החברה גם משחררת בקוד פתוח את כל משפחת מודלי AudioCraft – הכוללים גרסה משופרת של המפענח EnCodec, את כל מודלי AudioGen המאומנים שמאפשרים לאנשים ליצור סאונד ואפקטים קוליים (כמו כלב נובח, מכוניות צופרות או צעדים על רצפת עץ), וכן את הקוד והפרמטרים של כל מודלי AudioCraft. מטא גם תעניק לחוקרים ולאנשי מקצוע בתחום גישה למודלים הללו – כדי שיוכלו לאמן את המודלים שלהם עם מערכי הנתונים ולקדם את תחום האודיו והמוזיקה שמייצרת בינה מלאכותית.
בעוד שבתקופה האחרונה נרשמה התעניינות רבה סביב מודלי AI היוצרים תמונות, וידאו וטקסט – נראה היה שהאודיו עדיין נותר מעט מאחור. לצד זאת, מוזיקה היא ללא ספק סוג האודיו המאתגר ביותר ליצירה. לדברי מטא, בסיס משמעותי של קוד פתוח יעודד חדשנות וירחיב את הצורה שבה אנחנו צורכים ויוצרים מוזיקה. עם אפשרויות וכלים נוספים, MusicGen יכול להפוך לסוג חדש של כלי נגינה בעצמו, ממש כמו הסינתיסייזר בראשיתו, ומשפחת המודלים כולה יכולה לשמש כלי משמעותי בידיהם של מוזיקאים ויוצרים.