Он ушел из GenAI в знак протеста. Теперь он хочет создать более справедливые системы для художников.

Он покинул GenAI в знак протеста. Теперь он стремится создать более справедливые системы для художников.

Эд Ньютон-Рекс достиг точки перелома. В качестве вице-президента по аудио в компании Stability AI этому 36-летнему человеку досталась честь быть во главе революции в области вычислительного творчества. Но возникло недоверие по поводу стратегии движения.

Stability становилась новообразующейся силой в области генеративного искусственного интеллекта (ИИ). Эта стартап-компания из Лондона владеет Stability Diffusion, одним из самых популярных генераторов изображений в мире. Кроме того, недавно компания расширила свою деятельность на создание музыкальных генераторов с запуском Stable Audio в сентябре этого года – инструмента, разработанного самим Ньютон-Рексом. Но эти две системы шли разными путями.

Stable Audio обучалась на лицензированной музыке. Модель была пополнена набором данных более чем из 800 000 файлов из музыкальной библиотеки AudioSparx. Передача материалов с авторским правом происходила с разрешения.

Stable Diffusion пошла другим путем. Система обучалась на миллиардах изображений, срезанных с Интернета без согласия создателей. Многие из них являлись объектами авторского права. Все были взяты без оплаты.

Эти изображения хорошо обучили модель. Благодаря выходным данным от Diffusion, Stability была оценена в $1 млрд на привлечении инвестиций в размере $101 млн в прошлом году. Но система вызывала протест со стороны художников, в том числе со стороны Ньютон-Рекса.

Этическая дилемма GenAI

Пианист и композитор и пионер GenAI, Ньютон-Рекс не согласовывал несанкционированное срезание данных.

«Я всегда хотел убедиться, что эти инструменты создаются с согласия создателей обучающих данных», – говорит он TNW во время видеозвонка из своего дома в Силиконовой долине.

Stability далеко не единственный сторонник данного метода. Генераторы изображений MidJourney и Dall-E используют тот же подход, как и текстовый генератор ChatGPT от OpenAI и программист CoPilot. Визуальное искусство, письменные работы, музыка и даже код постоянно перерабатываются без согласия.

В ответ на это создатели и правообладатели запустили множество судебных процессов. Они возмущены тем, что их работы берут, модифицируют и монетизируют без разрешения или оплаты. Им также беспокоит, что их существование под угрозой.

«Промышленность искусственного интеллекта заинтересована в том, чтобы у людей сложилось впечатление, что только большие игроки могут это делать».

Художники говорят, что генеративный ИИ крадет их работы. Компании, стоящие за системами, не согласны с этим. В недавнем заявлении в Управление авторского права США, Stability объяснила, что обучение является «справедливым использованием», потому что результаты являются «трансформирующими» и «социально полезными».

Следовательно, по мнению компании, нарушение авторских прав не происходит. Практика может продолжаться без разрешения и оплаты. Это утверждение стало распространенным в GenAI, но Ньютон-Рекс с этим не согласен.

«Это действительно показало, где находится отрасль в настоящее время, и мне это не нравится», – говорит он.

Уход Ньютон-Рекса не означает, что он покидает генеративный ИИ. Напротив, он планирует продолжать работу в этой области, но по более справедливой модели. Это не такая невозможная задача, какими ее изображают гиганты GenAI. Фактически, такой подход уже применяется рядом компаний.

Доступны альтернативы

У Ньютон-Рекса давняя история в области вычислительного творчества. Спустя некоторое время после окончания университета Кембридж, где он изучал музыку, он основал Jukedeck, пионерского ИИ-композитора. Приложение использовало машиное обучение, чтобы сочинять оригинальную музыку по требованию. В 2019 году оно было приобретено владельцем TikTok, Bytedance.

Затем Ньютон-Рекс работал директором продукта в TikTok и главным продуктовым директором в Voicey, музыкальном приложении для сотрудничества, которое было приобретено командой Snap, прежде чем он присоединился к команде Stability AI в прошлом году. Ему была поручена руководящая роль в развитии аудио-возможностей стартапа.

«Я хотел создать продукт в области музыкального творчества, который бы показал, что можно сделать с настоящими лицензированными данными — согласованными с правообладателями», — говорит он.

Эта цель привела его в противоречие с многими лидерами индустрии. GenAI медленно становилась популярной, и компании стремились как можно быстрее выпустить новые системы. Извлечение контента из сети было привлекательным приемом.

Это было также очевидно эффективным. В то время еще возникали сомнения о том, достаточно ли большие лицензированные наборы данных для обучения современным моделям. Также возникали вопросы о качестве данных. Но оба эти утверждения теперь опровергнуты.

«То, что мы называем обучающими данными, на самом деле является результатом творческой деятельности человека».

Stable Audio стал одним из источников противоречий. Основная модель системы была обучена на лицензионной музыке в партнерстве с правообладателями. Полученные результаты вызвали аплодисменты. В прошлом месяце журнал Time включил Stable Audio в список одного из лучших изобретений 2023 года.

«Для меня это показало, что это возможно», — говорит Ньютон-Рекс.

Действительно, сейчас все больше компаний демонстрируют, что это возможно. Одной из них является Adobe, недавно выпустившая генеративную модель машинного обучения под названием Firefly. Система обучается на изображениях с Creative Commons, Wikimedia, и Flickr Commons, а также на 300 миллионах фотографий и видеозаписей из Adobe Stock и общественного достояния.

Поскольку эти данные предоставляются с разрешения, их можно использовать в коммерческих целях. Adobe также подчеркивает, что создатели, чьи работы используются, имеют право на вознаграждение.

Коллаж изображений, созданных Adobe Firefly
Фотографии в этом коллаже созданы Adobe Firefly, и были обучены на лицензированных изображениях. Кредит: Adobe

Другая альтернативная модель представлена компанией Getty Images. В сентябре она выпустила Generative AI by Getty Images, которая обучается исключительно на огромной библиотеке платформы. Генеральный директор фирмы Крейг Питерс заявил, что инструмент удовлетворяет «коммерческим потребностям, соблюдая интеллектуальную собственность создателей».

Nvidia также разработала GenAI в партнерстве с правообладателями. Служба Picasso технологического гиганта обучается на изображениях с лицензией от Getty Images, Shutterstock и Adobe. Nvidia заявляет, что планирует выплачивать роялти.

Эти подходы не подходят для всех. Корпорации с огромными содержательными пулами компании, стоящие за ними, располагают ресурсами, которые немногим бизнесам под силу. Однако стартапы показывают, что лицензирование может быть реализовано и с ограниченными финансовыми возможностями.

GenAI для людей

Bria AI представляет один пример такого рода. Компания разработала новую коммерческую модель на основе открытых исходных данных для создания изображений высокого качества. Все обучение производится на лицензированных наборах данных, созданных в сотрудничестве с ведущими агентствами по сбору фотографий и художниками. Модель разделяет доходы, обеспечивая вознаграждение творцам и правообладателям.

Это похожий подход на тот, который использовал Ньютон-Рекс в Stable Audio — но это не единственный подход.

Компании также могут предоставлять авансовые платежи художникам, создавать совместные предприятия, дающие правообладателям долю в бизнесе или использовать контент с лицензией Creative Commons, который может быть свободно использован без явного разрешения. Фирмы GenAI могут пренебрегать этими усилиями, но у них есть свои скрытые мотивы.

«AI-индустрии выгодно заставить людей думать, что это возможно только для крупных игроков, но это не так», — говорит Ньютон-Рекс.

«Возможно, вам придется быть немного изобретательным. Вы определенно должны провести некоторые переговоры и быть готовыми потратить время. Но в конечном итоге то, что мы называем обучающими данными, а что на самом деле является творческим выходом человека, является ресурсом для технологических компаний. Они должны работать, чтобы получить его так же, как любой другой ресурс».

Если они готовы к этому, GenAI может сотрудничать с художниками, и, надеюсь, дать нам всем насладиться творчеством, которое они оба воплощают.