Модераторы спят. Быстро, все выпускайте продукты искусственного интеллекта!

Модераторы спят. Поторопитесь и выпустите все продукты искусственного интеллекта!

Смятение в OpenAI за последние пять дней очаровывало техническую индустрию и удерживало предпринимателей, журналистов и всех, кто имеет аккаунт X, прикованных к своим лентам для последних обновлений эмодзи и сообщений без заглавных букв. Тем временем, некоторые из самых известных компаний искусственного интеллекта, включая OpenAI, продолжали делать то, за что Силиконовая Долина известна: выпускать новые продукты.

Неожиданное увольнение Сэма Альтмана, генерального директора OpenAI, сопровождалось лавиной новых возможностей искусственного интеллекта от конкурентов, включая Anthropic и Stable Diffusion. Во вторник днем, во время смятения, OpenAI представила бесплатно всем пользователям обновленный ChatGPT с голосовыми возможностями. OpenAI предварительно выпустила его в конце сентября, но только для платных пользователей. Теперь обновление стало более широко распространенным.

Несмотря на то что OpenAI доминировала в разговоре в Силиконовой Долине в 2023 году с продуктами, которые захватывали дух времени, такими как Dall-E 3 и ChatGPT, разработанный на базе GPT-4, хаос, вызванный решением совета директоров подорвать Альтмана и быстро назначить новых генеральных директоров, мог создать возможности для других компаний по искусственному интеллекту. (Несмотря на то, что Альтман в конце концов вернулся, чтобы продолжать руководить OpenAI.) И в то время, как эти обновления продуктов подготовились за много месяцев, время проведения их релиза для конкурентов OpenAI не могло быть лучше. Множество предприятий, использующих инструменты OpenAI, обеспокоенных уходом Альтмана, рассматривали возможность перехода на Anthropic или другого поставщика, пока он отсутствовал.

“Похоже, что каждую неделю что-то новое запускается или анонсируется одним из крупных игроков. Итак, я думаю, что выпуски Stable Video Diffusion и Claude 2.1 были просто совпадением”, – говорит Дармеш Шах, который является техническим директором и сооснователем HubSpot, а также акционером OpenAI.

После внезапного ухода Альтмана, пока судьба руководства OpenAI оставалась неопределенной, Anthropic анонсировала более мощную версию своего чатбота Claude, а Stability AI выпустила генератор текста в видео под названием Stable Video Diffusion.

Новая модель Anthropic, Claude 2.1, была дополнена двумя ключевыми обновлениями. Одно из них – возможность загрузки большего количества данных в чатбот и меньшее количество лжи. Теперь предел токенов для Claude составляет 200 000 токенов, что примерно равно объему книги в 500 страниц (извините, поклонники Льва Толстого, вам придется подождать будущих обновлений, чтобы проанализировать Войну и мир в один запрос). В сравнении, ограничение на количество токенов в модели GPT-4 Turbo, анонсированной Альтманом перед его уходом, составляет 128 000 токенов.

И Anthropic утверждает, что новый Claude более склонен признавать, когда он не уверен в ответе, а не уверено врать с максимальной уверенностью. “Мы проверяли честность Claude 2.1, составив большой набор сложных фактических вопросов, которые выделяют известные слабости текущих моделей”, – говорится в блоге компании. Недостаточная правдивость, часто описываемая как галлюцинации, по-прежнему является серьезной проблемой для чатботов.

В то время как вы уже можете получить доступ к Claude 2.1 сегодня, новая стабильная видеодиффузия от Stability AI пока открыта только для исследователей, прежде чем она будет доступна общественности для проб.

В отличие от инструментов искусственного интеллекта, выпущенных OpenAI, Stability AI сосредоточена на запуске открытого программного обеспечения. Новый инструмент искусственного интеллекта компании аналогичен Runway, еще одной модели текст-в-видео.

Когда вы вводите запрос в модель текст-в-видео, искусственный интеллект выдает анимации, похожие на GIF, которые могут быть как устрашающе красивыми, так и совершенно пугающими. В дополнение к возможностям текст-в-видео, Stable Video Diffusion может превратить ваши статичные изображения в видеоролики, добавляя движение.

Хотя это технически не новая функция от OpenAI, компания выпустила ChatGPT с голосовыми возможностями для всех на короткий период, пока Альтман был в отставке. Эта функция ранее была доступна только пользователям, оплачивающим ежемесячную подписку OpenAI в размере 20 долларов,

Он еще не напоминает “Она” Спайка Джонза, но разработчики программного обеспечения в OpenAI сделали еще один большой шаг к своей цели “мультимодальности”, предоставив чатботу возможность вести с вами разговор. Идея состоит в том, что чатбот может быть еще более мощным, если он может принимать входы и предоставлять выходы в нескольких форматах, таких как голос, текст и изображения. Кто знает, когда он научится пахнуть.

По мере того, как год подходит к концу, быстрый темп инноваций в области искусственного интеллекта не снижается. Недавно после того, как стало известно, что Альтман вернется на пост генерального директора OpenAI, Inflection AI, еще один конкурент, объявил о модернизированной модели для своего чатбота Pi. Если вы надеялись на перерыв в оглушительных новостях об искусственном интеллекте, не сдерживайте дыхание.