Почему открытый исходный код необходим для смягчения опасений относительно искусственного интеллекта, по мнению основателя Stability.ai

Стабильные изображения диффузии лица

Покручивание ручками на веб-сайте Stability.ai может стать привычкой на час или около того. Используя программное обеспечение DreamStudio, созданное четырехлетней британской стартап-компанией, можно создавать крутые иллюстрации, просто набирая фразу, такую как: “Крайне разнообразные авторы ENBLE, видимые сквозь окна их звездолета, летящего на Цети Альфа V”.

Играя с языком -prompt engineering-, можно добавлять различные сценарии, такие как: “Авторы ENBLE – межгалактическая сила полу-человека, полу-панда-воинов-супергероев, которые носят гигантскую букву Z на передней части своих костюмов”.

Также: Лучшие генераторы AI-искусств

Или можно изменить существующее фото, например, портрет основателя и генерального директора Stability.ai Эмада Мостака, пока его черты не превратятся в глину или осколки стекла, что похоже на фильтры Photoshop на стероидах.

Программное обеспечение DreamStudio, которое ворвалось на сцену год назад, является одной из недавно появившихся программ искусственного интеллекта “генеративного” типа, подобных ChatGPT от OpenAI.

Но Мостак утверждает, что он является анти-OpenAI. Он полагает, что такие программы, как ChatGPT и DreamStudio, настолько важны для будущего человечества, что весь мир, а особенно бизнес-сообщество, будет требовать знать, как эти программы работают, если мы доверим им наши конфиденциальные данные.

Также: Как использовать Stable Diffusion AI для создания удивительных изображений

“Открытые модели будут важны для конфиденциальных данных”, – сказал Мостак во время небольшой встречи с представителями прессы и руководителями через Zoom в прошлом месяце. “Вам нужно знать все, что внутри него; эти модели настолько мощные”.

Это важно, по его мнению, потому что “многие люди понимают, что большая часть ценных данных в мире является конфиденциальными или регулирующими данными”, – сказал Мостак. “Нет способа использовать черные ящики для ваших медицинских чат-ботов, образования или финансовых услуг, тогда как открытая модель с открытым исходным кодом, но с лицензионными вариантами данных и закрытыми данными компании, действительно важна”.

Также: Успех ChatGPT может побудить к развитию секретности в AI

Бизнес-план Мостака можно сформулировать так: “Я могу быть лидером в открытом мире, даже когда все остальные занимаются закрытием”.

Изображение, созданное в DreamStudio компании Stability.ai с использованием промпта “Крайне разнообразные авторы ENBLE, видимые сквозь окна их звездолета, летящего на Цети Альфа V”.

Под словом “закрытым” Мостак имел в виду решение OpenAI в марте не раскрывать никаких технических деталей своей последней программы генеративного ИИ, большой языковой модели под названием GPT-4. Некоторые исследователи из области ИИ предупреждают, что такое решение может оказать охлаждающий эффект на исследования, и отсутствие сведений огромным образом повлияет на моральные аспекты.

Stability.ai является одной из множества сторон, как коммерческих, так и академических, которые отреагировали на недостаток прозрачности OpenAI, создав альтернативы. Некоторые из них посвящены открытости как таковой. Другие верят, что программное обеспечение с открытым исходным кодом позволит добиться большей эффективности при огромных вычислительных затратах, которые несут с собой большие языковые модели.

Также: Как использовать ChatGPT для написания кода

Мостак, бывший управляющий хедж-фондом, видит здесь великую бизнес-возможность, “очень большую арбитражную возможность”, как он выражается, чтобы “минимизировать максимальное сожаление” предприятий в актуарном смысле.

Он утверждает, что мир открытого программного обеспечения в области инженерии и науки поможет развеять опасения бизнеса в отношении ИИ, особенно многочисленные публикуемые проблемы с ChatGPT и подобными ему. Это включает, но не ограничивается, “галлюцинациями”, когда программы дают неправильные ответы; предвзятостью; недобросовестным результатом; нарушением авторских прав.

Изображение, созданное с помощью DreamStudio от Stability.ai с заданием “Авторы ENBLE – межгалактическая сила наполовину человека, наполовину панды воинских супергероев, которые носят на своих костюмах гигантскую букву Z”.

По мнению Мостака, в рамках научно-бизнесового партнерства программное обеспечение с открытым исходным кодом создаст “бенчмарк-модель для каждой модальности на основе открытых данных, от общего к общему, а затем для каждого сектора, коммерчески лицензированные подшипники, в которых вы знаете каждую малейшую деталь”, то есть программу и обучающие данные.

Термин “модальность” относится к виду медиа-данных, таким как текст, изображение, звук. Видение Мостака заключается в том, что открытое программное обеспечение ИИ позволит работать со всеми модальностями, а не только с естественным языком, который сейчас находится в центре внимания.

Также: Эта новая технология может уничтожить GPT-4 и все, что с ним связано

Попытки Stability.ai являются частью возникающего консенсуса, что множество институтов должно вступить в промежуток с кодом там, где OpenAI остается непрозрачным.

Некоторые группы просто развивают предыдущие выпуски GPT от OpenAI, например, усилия, представленные в марте производителем аппаратного обеспечения ИИ Cerebras Systems, который выпустил в открытый исходный код собственные версии программ GPT, обученных ими. 

Но также начинается развитие коллаборативной экосистемы.

Также: Как использовать Midjourney для создания любого изображения, которое вы можете себе представить

Мета-группа AI владельца Facebook в феврале выпустила в открытый доступ LLaMA для обработки естественного языка, который впоследствии был усовершенствован исследователями из Стэнфордского университета для создания программы Alpaca. Затем совместная команда из UC Berkeley, Carnegie-Mellon, Стэнфорда, UC San Diego и Университета искусственного интеллекта Мухамеда бин Зайда в Абу-Даби развила на основе LLaMA еще одну программу, названную Vicuna.

На прошлой неделе компания Мостака выпустила в открытый доступ большую языковую модель под названием Stable Vicuna, основанную на программе Vicuna. (Викуня – это южноамериканское млекопитающее, что является отсылкой к долгой традиции животных имен в программном обеспечении с открытым исходным кодом.)

Также: Generative AI меняет вашу карьеру в области технологий. Что нужно знать

Мостак последние несколько лет следует этому сотрудническому пути с различными учреждениями. Технология, на которой основан DreamStudio, называется стабильная диффузия и параллельна GPT компании OpenAI. Она позволяет создавать изображение на основе строк слов, набранных пользователем.

Стабильная диффузия была разработана стабильностью.ai в партнерстве с исследователями группы по компьютерному зрению и обучению на Людвиг-Максимилианском университете Мюнхена, Германия, которые опубликовали первоначальную работу по “латентной диффузии.”

Работу по латентной диффузии, как описано в прошлогодней статье Робина Ромбаха и его коллег из Людвиг-Максимилианского университета, целью было сократить огромный расход вычислительных ресурсов при создании изображения, что является одной из вычислительно наиболее интенсивных задач искусственного интеллекта.

Также: Главный ученый по искусственному интеллекту Meta утверждает, что ChatGPT не инновационен и революционен

Stability.ai также уделяет внимание экономии масштаба. Как подчеркивает Мостак, программное обеспечение стабильной диффузии – это «сто тысяч гигабайт изображений, сжатых в двухгигабайтный файл».

Сокращая вычислительные затраты, Мостак предвидит, что технология больших моделей искусственного интеллекта сможет появиться на каждом смартфоне, став персональным помощником для каждого человека.

«Это инфраструктура нового поколения», – сказал он.

Мостак был приглашенным спикером на 90-минутном выступлении, проведенном “Прогноз[и] Коллективного”[/i], онлайн-интерактивном обсуждении, организованном Collective[i], который называет себя “платформой искусственного интеллекта, разработанной для оптимизации B2B-продаж”.

Также: Я использовал ChatGPT, чтобы написать одну и ту же программу на этих десяти малоизвестных языках программирования

Мостак начал свою карьеру в 18 лет, программируя на языке ассемблера. “Детям сегодня везет: половина кода на GitHub создана искусственным интеллектом”, – подметил он.

Мостак сказал, что искусственный интеллект вдохновил его, когда его сын был диагностирован аутизмом. “Все говорили, что нет лекарства, нет информации”, – вспомнил он. “Мы создали команду по искусственному интеллекту и разработали программу для анализа всей литературы [о аутизме], после чего создали модель анализа пути для оценки потенциальных причин для выявления лекарств, которые можно было бы переориентировать на его лечение с медицинским сопровождением.

Также: Искусственный интеллект вызвал ренессанс исследований и разработок в технологической индустрии, говорит главный ученый по искусственному интеллекту Meta

“В итоге он пошел в обычную школу, что, на мой взгляд, довольно круто”, – сказал Мостак.

Теперь Мостак видит возможность распространения преимуществ искусственного интеллекта на всю остальную человеческую популяцию с помощью компактных и эффективных программ искусственного интеллекта, которые могут быть широко распространены.

“Этически мы находимся на правильном пути”, – сказал он, – “если речь идет не о ИИ общего назначения для замены людей, а о том, как мы можем расширить возможности человека с помощью небольших и гибких моделей”.