Gemini Pro 1.5 Обновление модели AI от Google!

Только через два месяца после того, как компания Alphabet выпустила свою модель искусственного интеллекта Gemini для широкой публики, они теперь представляют обновленную версию, способную обрабатывать значительно больше аудио-, видео- и текстовых входных данных, чем GPT-4.

Модель искусственного интеллекта Google получает мощное и быстрое обновление.

📷 Источник: Enble.com

Модель искусственного интеллекта Gemini от Alphabet только что получила значительное обновление. Запускаясь с ограниченной доступностью сегодня, Gemini Pro 1.5 стал еще мощнее своего предшественника и способен обрабатывать большие объемы текстов, видео или аудио ввода одновременно. Это похоже на наличие у вас усиленного мозга!

Демис Хассабис, генеральный директор Google DeepMind, команды, стоящей за этой новой моделью, сравнивает ее объем ввода с рабочей памятью человека. Когда-то он, будучи нейробиологом, исследовал концепцию памяти. Теперь он использует эти знания для создания прорывных технологий. По словам Хассабиса: «Замечательная черта этих основных возможностей заключается в том, что они позволяют модели делать всякие побочные вещи».

На захватывающем демонстрационном видео Google DeepMind показал, как Gemini Pro 1.5 анализирует огромный 402-страничный PDF с передачами связи Apollo 11. Затем модели было предложено найти смешные моменты, и она забавно выделила моменты, когда астронавты винили задержки в связи в перерывах на бутерброды 🥪. В другой демонстрации модель точно отвечала на вопросы о конкретных действиях в фильме Бастера Китона. Предыдущая версия Gemini не смогла бы выполнить эти задачи с такими длинными текстами или видео. С новыми возможностями Google надеется, что разработчики смогут создавать инновационные приложения на основе этой модели.

«То, как модель выполняет эту логическую работы в каждой странице, в каждом слове, просто поражает», – говорит Ориол Виньялс, научный сотрудник Google DeepMind, четко восхищенный способностями искусственного интеллекта.

Gemini Pro 1.5 теперь может обрабатывать час видео, 11 часов аудио, 700 000 слов или 30 000 строк кода одновременно – впечатляющая возможность, превосходящая другие модели искусственного интеллекта, такие как GPT-4 от OpenAI, который управляет ChatGPT. Однако Google пока не раскрыл технические детали этого достижения. Хассабис раскрывает, что одним практическим применением моделей, способных обрабатывать большие объемы текста, проверенных исследователями Google DeepMind, является нахождение ключевых моментов в обсуждениях на Discord с тысячами сообщений.

Более того, Gemini Pro 1.5 продемонстрировал свое мастерство на нескольких популярных бенчмарках, став еще более компетентным, несмотря на свой меньший размер. Google добился этого, применив изобретенную их исследователями технику, называемую «смесь экспертов». Эта техника активирует части архитектуры модели, наилучшим образом подходящие для данной задачи, что облегчает процесс обучения и выполнения.

Говоря о эффективности, разработчики смогут протестировать Gemini Pro 1.5 в среде AI Studio, песочнице. Кроме того, ограниченному числу разработчиков будет предоставлен доступ к модели через API платформы Google Cloud Vertex AI. Общая дата выпуска пока не объявлена.

Чтобы поддержать разработчиков в максимальном использовании потенциала Gemini, Google также запускает новые инструменты, позволяющие использовать возможность модели анализировать видео- и аудиоданные. Более того, веб-ориентированное средство программирования Project IDX будет включать функции, основанные на Gemini, включая отладку и тестирование кода, осуществляемые с помощью искусственного интеллекта.

Целеустремленное развитие Gemini является свидетельством жесткой конкуренции, возникшей после успеха ChatGPT. Недавно OpenAI объявила, что ChatGPT теперь обладает возможностью помнить и вспоминать полезную информацию из предыдущих разговоров. И на переднем плане в этой гонке за искусственным интеллектом Google переименовал своего чат-бота в Bard и представил платную подписку на более мощную модель Gemini Ultra.

В то время как прогресс в области генеративного искусственного интеллекта вызывает восторг, остаются опасения относительно потенциальных рисков, связанных с этой технологией. Google заявляет, что провела тщательное тестирование Gemini Pro 1.5 и предлагает ограниченный доступ для сбора отзывов о потенциальных рисках. Компания даже предоставила доступ к своим самым мощным моделям исследователям AI Safety Institute в Великобритании для целей тестирования.

Согласно Хассабису, это только начало. Ожидайте, что Google продолжит преодолевать границы в следующие месяцы. «Это новый ритм», – говорит он, – «Я пытаюсь перенести от некого стартап менталитет».

👥 Вопросы и ответы читателей:

Q: Как Gemini Pro 1.5 сравнивается с предыдущей версией?

A: Gemini Pro 1.5 – значительное обновление по сравнению с предыдущей версией. Он может обрабатывать большие объемы текста, видео или аудио ввода одновременно, превосходя возможности предыдущей модели. Это расширение открывает новые возможности для разработчиков в создании инновационных приложений на основе Gemini.

Вопрос: Можете ли вы предоставить больше информации о Gemini Ultra от Google?

Ответ: Gemini Ultra – самое мощное предложение от Google. Хотя он значительно крупнее, чем Gemini Pro 1.5, та же самая техника, используемая для улучшения Pro-версии, потенциально может быть применена для усиления возможностей Gemini Ultra.

Вопрос: Как Gemini Pro 1.5 сравнивается с GPT-4 от OpenAI?

Ответ: Gemini Pro 1.5 превосходит GPT-4 от OpenAI по вместимости ввода. Он может обрабатывать большие объемы текста, видео или аудио, что делает его более мощным и гибким. Однако специфические подробности о технических достижениях в настоящее время не разглашаются.

Вопрос: Как Google планирует выпустить Gemini Pro 1.5 для разработчиков?

Ответ: Google сделает Gemini Pro 1.5 доступным для разработчиков для тестирования через AI Studio, который служит средой-песочницей для изучения возможностей модели. Ограниченное количество разработчиков также получат доступ к модели через API облачной платформы Vertex AI от Google.

Вопрос: Какие дополнительные инструменты Google запускает вместе с Gemini Pro 1.5?

Ответ: Вместе с моделью обновленные модели Google предлагает новые инструменты, которые помогут разработчикам интегрировать Gemini в свои приложения. Эти инструменты включают способы использования возможности модели анализировать видео- и аудиоданные. Кроме того, Google представляет функции, основанные на Gemini, в Project IDX, их веб-инструменте для написания кода, что позволит отладку и тестирование кода на основе искусственного интеллекта.

🚀 Влияние и будущие разработки

Обновленный Gemini Pro 1.5 является свидетельством текущей гонки искусственного интеллекта, питаемого последними технологическими прорывами. Быстрый прогресс в технологии генеративного искусственного интеллекта демонстрирует быстрое развитие этих моделей, хотя все еще существуют опасения о потенциальных рисках. Благодаря стремлению Google к постоянному совершенствованию и их готовности работать вместе с исследователями на Институте безопасности искусственного интеллекта, мы можем ожидать еще более захватывающих разработок в этой области в ближайшем будущем.

🔗 Связанные ссылки и справочные материалы:

  1. Google DeepMind – официальный сайт
  2. GPT-4 и ChatGPT от OpenAI
  3. Google представляет Bard, переименованный чатбот
  4. OpenAI улучшает восстановление памяти ChatGPT
  5. Первый релиз Gemini AI модели от Google DeepMind

🙌 Если вам понравилась эта информативная статья, поделитесь ею в социальных сетях и пригласите своих друзей присоединиться к разговору! 💬