«ИИ и ты Сэм Альтман из OpenAI уволен, наступление синтетических исполнителей»

Сэм Альтман, известный как основатель OpenAI, уволен из-за его работы с ИИ, а также предупределенное наступление синтетических исполнителей

Общепринятая мудрость в журналистике гласит, что когда компания публикует заявление в пятницу вечером, это обычно несет хорошие новости.

И так случилось, что OpenAI объявила 17 ноября, что они уволили сооснователя и генерального директора Сэма Альтмана, а также главного защитника чат-бота ChatGPT, основанного на искусственном интеллекте. Совет попросил Альтмана уйти, потому что у них больше нет уверенности в его способности руководить компанией, базирующейся в Сан-Франциско, согласно блог-посту, в котором OpenAI объявила о переходе в руководстве.

“Уход мистера Альтмана был результатом рассмотрения советом, которое пришло к выводу, что он не всегда был искренен в своей коммуникации с советом, что препятствовало выполнению его обязанностей. Совет больше не верит в его способность продолжать руководить OpenAI.”

Ой. Наверное, он не будет присутствовать на первом дне рождения ChatGPT 30 ноября.

Члены совета, которые уволили Альтмана, – главный ученый OpenAI Илья Сутскевер и независимые директоры OpenAI, генеральный директор Quora Адам Д’Анджело, предприниматель в сфере технологий Таша Маккаули и Георгетаунский центр по безопасности и предстоящим технологиям Хелен Тонер. Мира Мурати, главный технологический директор компании, назначен исполняющим обязанности генерального директора, пока OpenAI ищет постоянного заменителя для Альтмана. Как также заявила компания в пятницу, Грег Брокман, один из сооснователей, покидает должность председателя совета.

OpenAI сказал мне, что у них нет дополнительных комментариев и направил меня обратно к их блог-посту.

Это достаточно серьезное событие в отрасли искусственного интеллекта, учитывая, что Альтман был лицом, символизирующим поколение генеративных чат-ботов на основе искусственного интеллекта, от прославления потенциала ChatGPT в поддержке достижений человечества до призыва регуляторов предложить законодательство, которое поможет компаниям разрабатывать инновации с учетом потенциальных угроз безопасности, конфиденциальности и угроз для существования человечества. ChatGPT является самым посещаемым инструментом на базе искусственного интеллекта, согласно Similarweb, с более чем 1,5 миллиардом посещений в октябре.

По данным The New York Times, это было “поразительное падение для мистера Альтмана, 38 лет, который в последний год стал одним из самых известных руководителей технической отрасли и одним из самых увлекательных персонажей”. Согласно описанию CNN Альтмана, он стал “квази-знаменитостью за ночь и лицом нового поколения инструментов искусственного интеллекта, способных генерировать изображения и тексты в ответ на простые запросы пользователей”. The Guardian описывает уход Альтмана как “крупное потрясение в мире искусственного интеллекта”. Отмечается, что его уволили за “предполагаемую ложь перед советом его компании”, но не ясно, что именно Альтман скрывал от собственного совета.

“В Силиконовой Долине Альтман давно известен как умный инвестор и поддерживающий малые компании, но благодаря успеху OpenAI он поднялся в ряды лидеров технической отрасли вместе с Маском, главным исполнительным директором Meta Марком Цукербергом и даже уже покойным генеральным директором Apple Стивом Джобсом”, – отмечает The Washington Post.

Я спросил ChatGPT, что он может рассказать мне о совете OpenAI и их решении уволить генерального директора Сэма Альтмана. Он извинился за то, что не может ответить, так как у него нет доступа к актуальным новостям или конкретной информации о недавних событиях. (Его обучение заканчивается в сентябре 2021 года.) Он описал Альтмана как “американского предпринимателя и инвестора”.

Что касается Алтмана, который стал CEO в 2020 году после того, как помог начать OpenAI в 2015 году как некоммерческую организацию с поддержкой технологических миллиардеров Илона Маска, Питера Тила и Рида Хоффмана, он заявил в посте на X (также известном как Twitter), что он “любил время, проведенное в openai. для меня это было трансформационным и личностным, и, надеюсь, что немного изменило мир. больше всего мне нравилось работать с такими талантливыми людьми”.

Он добавил, что “позже он будет иметь больше информации о том, что будет следующим”.

В журналистском плане это означает, что это развивающаяся история. Следите за обновлениями.

Вот что еще происходит в области искусственного интеллекта и стоит вашего внимания.

Клоны, цифровые двойники и синтетические актеры

Одной из проблем, связанных с генеративным искусственным интеллектом, является возможность использования технологии для копирования реальных людей и обмана, заставляя вас думать, что эти люди делают или говорят что-то, чего они на самом деле не делали или не говорили. Вот что происходит с deepfakes, которые, как следует из названия, предназначены для обмана или введения в заблуждение. Актер Том Хэнкс предупредил в октябре, что клон AI с рекламирует стоматологическую страховку в несанкционированной рекламе. В то время как вводится его Executive Order, регламентирующий развитие и использование искусственного интеллекта, президент Джо Байден пошутил о deepfake-двойнике, который копирует его голос.

Но помимо рекламы и информационных кампаний, актеры и исполнители Голливуда также беспокоятся о том, что генAI может быть использовано студиями Голливуда и создателями контента для создания цифровых двойников или синтетических исполнителей вместо использования (и оплаты) людей. Несмотря на то, что забастовка актеров в Голливуде была разрешена, сделка включает ограничения для использования генAI в индустрии, требующие, чтобы актеры давали разрешение продюсерам на создание и использование их цифровых копий.

Джастин Бейтмен, актер, который выступал в качестве советника профсоюза для переговоров по генAI с Голливудом, подводит итог основной проблемы в своем посте на X (ранее известном как Twitter) на прошлой неделе.

«Выиграть прослушивание может стать очень сложно, потому что вы будете конкурировать не только с доступными актерами вашего типа, но и с любым актером, мертвым или живым, который сделал свою ‘цифровую двойнику’ доступной для аренды в широком спектре возрастов, подходящем для персонажа», написала Бейтман в твите. «Вы также будете конкурировать с бесконечным количеством AI-объектов, которые студии/стримеры могут свободно использовать. И целая группа AI-объектов вместо актеров-людей устраняет необходимость в съемочной группе или членов экипажа вообще».

Насколько легко использовать искусственный интеллект для создания цифровых двойников и синтетических исполнителей? Позвольте мне выделить три интересных новости о разработках в области и ИИ на прошлой неделе, которые подчеркивают эту проблему.

Первая новость приходит от Чарли Хольца, “жителя хакера” в Replicate, стартапе по машинному обучению. Хольц создал клон искусственного интеллекта британского биолога и историка Сэра Дэвида Аттенборо, сообщает Insider. В посте на X Хольц показал, как он смог воспроизвести характерный голос документалиста. Результат: “Вот что происходит, когда Дэвид Аттенборо озвучивает вашу жизнь”.

Хольц свободно поделился кодом, позволяющим использовать голос Аттенборо. На момент написания статьи Аттенборо не ответил на запрос Insider, но эксперимент Хольца был просмотрен более чем 3,5 миллиона раз. Один комментатор сказал, что с нетерпением ждет, когда Аттенборо будет “озвучивать видео моего ребенка, учащегося есть брокколи”.

Второй – это экспериментальный музыкальный инструмент под названием Dream Track от YouTube, позволяющий создавать музыкальные треки путем клонирования голосов девяти музыкантов — включая Джона Ледженда, Деми Ловато и Сию — с их разрешениями. Созданный в сотрудничестве с лабораторией искусственного интеллекта DeepMind AI от Google, Dream Track находится на тестировании среди ограниченной группы создателей из США, которые могут создавать саундтреки для своих короткометражек на YouTube, вводя свою идею песни в prompt и выбирая одного из девяти артистов. Инструмент затем создаст оригинальный саундтрек для короткометражки, используя сгенерированный искусственным интеллектом голос артиста.

“Принять участие в эксперименте Dream Track на YouTube – это возможность способствовать формированию возможностей для будущего,” – сказал Ледженд в своей рекомендации, опубликованной на блоге YouTube. “Как художник, я рад иметь место за столом и с нетерпением жду того, что создатели придумают во время этого периода”.

Шарли КсКс казалась более осторожной в своей поддержке. “Когда меня впервые обратились к YouTube, я была несколько насторожена и по-прежнему остаюсь, AI собирается преобразовать мир и музыкальную индустрию таким образом, о котором мы еще не до конца понимаем. Этот эксперимент предложит маленький взгляд на творческие возможности, которые могут стать возможными, и я интересуюсь, что из этого выйдет.”

Вы можете прослушать пример с T-Pain, созданный по запросу: “солнечное утро во Флориде, R&B“. Еще один клон Чарли Пуффа представляет “балладу о притяжении противоположностей, бодрый акустика“.

Новости о Dream Track появились одновременно с тем, когда YouTube анонсировал свои руководящие принципы “ответственной инновации искусственного интеллекта” на своей платформе. Создателям видео придется выбирать из некоторых категорий контента, чтобы раскрыть, содержит ли видео реалистично измененный или синтезированный материал … Это особенно важно в случаях, когда контент обсуждает чувствительные темы, такие как выборы, текущие конфликты и общественные кризисы в области здравоохранения или государственные служащие.

Третий набор технологий genAI, на который я обращаю внимание, представлен Метой, Emu Video и Emu Edit. Простой инструмент генерации видео из текста, Emu Video позволяет создавать 4-секундный анимированный клип со скоростью 16 кадров в секунду, используя только текст, только изображение или и текст, и изображение. Emu Edit предлагает простой способ редактирования этих изображений. Вы можете сами убедиться, как это работает.

Демонстрационный инструмент Meta позволяет выбирать из набора изображений – панда в солнечных очках, фавн Пемброк-уэльский корги, среди них – и затем вы можете выбрать из предоставленных подсказок, чтобы ваш персонаж появился в Центральном парке или под водой, во время медленного движения или катания на скейтборде в реалистичном или аниме-манга стиле. Я выбрал танцующего кота в Times Square в стиле бумажно-вырезной иллюстрации.

Emu Video от Meta позволяет создавать 4-секундные анимированные видео, выбирая из набора изображений и текстовых описаний. Я выбрал танцующего кота в Times Square в стиле бумажно-вырезной иллюстрации.

Программа Emu Video от Meta

Вы можете подумать: “О, это легкий способ создать GIF”. Но в недалеком будущем вы сможете поместить самые разные персонажи в инструмент и всего несколькими словами создать короткометражный фильм.

Есть искусственный интеллект, есть путешествия? В каком-то смысле да

Один из самых популярных случаев использования чат-ботов – помощь в планировании путешествий, трудоемкий и трудоемкий процесс составления подробного маршрута. И хотя есть много анекдотических отчетов о том, что genAI может сделать эту работу за вас, Кэти Коллинз из ENBLE напоминает нам, что составление маршрута – это не только создание списка мест, которые следует посетить и делать.

“Лучшие маршруты будут связывать ваши дни логически и тематически”, – писала Коллинз о составлении маршрута по своему родному городу Эдинбургу в Шотландии, месту, которое, по ее словам, она знает хорошо. Она полагалась на такие инструменты, как ChatGPT, GuideGeek, Roam Around, Wonderplan, Tripnotes и приложение Out of Office или OOO.

“Путешествие между достопримечательностью А и достопримечательностью Б будет частью развлечения, проводя вас по живописной улице или предоставляя удивительный вид, который вы могли бы увидеть иначе. Оно также будет хорошо спланировано, учитывая, что к третьей галерее в течение дня даже самые культурные из нас, вероятно, будут бороться с усталостью от музея”, – сказала она.

Так что, хотя чат-боты могут создавать списки известных и популярных достопримечательностей, Коллинз сказала, что “очень мало из составленных мной AI маршрутов для Эдинбурга соответствует этому заданию”, и “Тот факт, что AI использует исторические данные, делает его невероятно устаревшим”, из-за чего вы можете попасть в места, которых уже нет.

Таким образом, как и в случае с большинством genAI, вам нужно будет дважды проверить, подтвердить и перепроверить то, что вам говорит AI, прежде чем вы отправитесь в путь. Коллинз предупреждала: “Это относится ко всему, что она вам говорит”.

Насколько сильно это галлюцинации?

История Коллинз напомнила мне о целой проблеме галлюцинаций – когда чат-боты дают ответы на вашу просьбу, которые не являются правдой, но звучат как правда – это всё ещё большая проблема для больших языковых моделей, таких как ChatGPT и Google Bard.

Исследователи из стартапа под названием Vectara, основанного бывшими сотрудниками Google, пытались определить, насколько велика эта проблема, и обнаружили, что “чат-боты придумывают информацию хотя бы на 3% – и до 27%”, сообщает New York Times.

В данный момент Vectara публикует “Таблицу галлюцинаций”, которая оценивает, насколько часто LLM галлюцинирует при резюмировании документа. На 1 ноября она дала высшие оценки GPT 4 от OpenAI (3% уровень галлюцинации) и самые низкие оценки технологии Palm 2 от Google, у которой уровень галлюцинации составляет 27,2%. “Таблица галлюцинаций” будет регулярно обновляться с развитием нашей модели и LLM”, – говорится в заявлении компании.

Microsoft представляет собственную чипсетку искусственного интеллекта

Microsoft представил первый чипсет из серии Maia для искусственного интеллекта, заявив, что разработал его для работы своего облачного бизнеса и программного обеспечения подписки, а не для перепродажи другим поставщикам, сообщает CNBC, Reuters и ENBLE.

“Чипсет Maia разработан для работы с большими языковыми моделями, типом программного обеспечения искусственного интеллекта, на котором базируется сервис Azure OpenAI от Microsoft и является результатом сотрудничества Microsoft с создателем ChatGPT OpenAI”, – говорит Reuters. “Майкрософт и другие гиганты технологической индустрии, такие как Alphabet (GOOGL.O), сталкиваются с высокой стоимостью предоставления услуг искусственного интеллекта, которая может быть в 10 раз больше, чем для традиционных услуг, таких как поисковые системы.”

CNBC, ссылаясь на интервью с вице-президентом Microsoft Рани Боркар, отметил, что “Microsoft тестирует, как Maia 100 соответствует потребностям своего искусственного интеллекта чат-бота Bing (теперь называемого Copilot вместо Bing Chat), помощника по кодированию GitHub Copilot и GPT-3.5-Turbo, большой языковой модели от OpenAI, подкрепленной Microsoft”, содержащего интервью с вице-президентом Microsoft Рани Боркар.

Maia 100 имеет 105 миллиардов транзисторов, что делает его “одним из самых крупных чипов на технологии 5 нанометров”, относясь к размеру самых мелких элементов чипа, пять миллиардных долей метра, — сообщает ENBLE.

Термин недели: Глубокое обучение

Когда люди говорят о искусственном интеллекте, вы можете слышать о том, будет ли он (или нет) имитировать человеческий мозг. Вот почему появляется термин “глубокое обучение”. Вот две определения, первое из которых простое объяснение от Coursera.

Глубокое обучение: Функция искусственного интеллекта, которая имитирует человеческий мозг, изучая, как он структурирует и обрабатывает информацию для принятия решений. Вместо использования алгоритма, который может выполнять только одну конкретную задачу, этот подвид машинного обучения может изучать неструктурированные данные без руководства.”

Второй определение от IBM, который также предлагает объяснение того, как работает глубокое обучение.

“Глубокое обучение: Подвид машинного обучения, который представляет собой нейронную сеть с тремя или более слоями. Эти нейронные сети стремятся имитировать поведение человеческого мозга — хотя далеко не могут сравниться с его способностями — позволяя ему «обучаться» на больших объемах данных. В то время как нейронная сеть с одним слоем все равно может делать приближенные предсказания, дополнительные скрытые слои могут помочь оптимизировать и улучшить точность.”

Глубокое обучение приводит к созданию множества приложений и сервисов искусственного интеллекта, которые улучшают автоматизацию и выполняют аналитические и физические задачи без участия человека. Технология глубокого обучения лежит в основе повседневных продуктов и услуг (таких как цифровые ассистенты, голосовые пульты ТВ и обнаружение мошенничества с использованием кредитных карт), а также новых технологий (например, автономных автомобилей).”

Примечание редакторов: ENBLE использует искусственный интеллект для создания некоторых материалов. Для получения дополнительной информации смотрите этот пост.