גוגל ל-OpenAI: הפסיקו להשתמש ב-YouTube לאימון ChatGPT

גוגל (Google) טוענת כי OpenAI השתמשה באופן חופשי בתכני וידאו שהתפרסמו ביוטיוב (YouTube) לצורך אימון מודל הבינה המלאכותית שלה, וכי מדובר מדובר בהפרה בוטה של תנאי השימוש, כולל פגיעה בזכויותיהם של יוצרי התוכן ובגוגל עצמה. ״כאשר יוצרים מעלים תוכן לפלטפורמה שלנו, יש להם ציפיות מסוימות. הם מצפים שתנאי השימוש ישמרו, ולא מסכימים לתמלול טקסטואלי או להורדה בלתי חוקית של הקבצים״, כך טען מנכ״ל YouTube ניל מוהאן.

מאמר המתפרסם בוול סטריט ג׳ורנל מצביע על בעיה שהולכת והופכת קריטית עבור חברות המשקיעות מיליארדי דולרים בתחום הבינה המלאכותית: מאגרי המידע הזמינים לאימון המודלים אינם גדולים מספיק, ולצורך השלמת פערים בוחרות אותן חברות להלך לעיתים קרובות על התחום האפור שבין שימוש סביר והפרת זכויות יוצרים.

לפי הוול סטריט ג׳ורנל, פתרון אחד שאותו ניסתה OpenAI היא תמלול של סרטוני וידאו מ-YouTube לטקסט תוך שימוש במודל Whisper המשמש לצורך הבנת פקודות קוליות של המשתמשים, ולאחר מכן הזנת התוכן לתוך GPT-4 לצורך אימון הבינה המלאכותית. לפי הדיווח נשיא החברה גרג ברוקמן היה מעורב באופן אישי בפרויקט, שהניב ל-OpenAI כמות עצומה של תוכן ללא תשלום.

מה שמסבך מעט את העניינים הוא שלפי אותו דיווח גם גוגל עצמה השתמשה בתכני הווידאו של YouTube לצורך אימון המודל הבינה המלאכותית שלה, Gemini. בחברה טוענים עם זאת כי האימון הוגבל ליוצרים שהסכימו לכך, אלא שאותה ‘הסכמה’ עשויה להיות גם חתימה על חוזה תנאי השימוש הכללי – אותו שינתה גוגל בחודש יולי האחרון בכדי לשמור לעצמה את הזכויות לאמן את הבינה המלאכותית שלה באמצעות תכני המשתמשים.