Что такое Gemini? Все, что вам следует знать о новой модели искусственного интеллекта Google

Что такое Gemini? Все, что нужно знать о новой модели искусственного интеллекта Google

На ноутбуке отображается веб-сайт Google Gemini с надписью «Добро пожаловать в эру Gemini»

Что такое Google Gemini?

Gemini – это новая и мощная модель искусственного интеллекта от Google, которая способна понимать не только текст, но и изображения, видео и аудио. Как модель с несколькими режимами, Gemini описывается способностью выполнять сложные задачи в математике, физике и других областях, а также понимать и генерировать качественный код на разных языках программирования.

В настоящее время она доступна через интеграции с Google Bard и Google Pixel 8, а постепенно будет интегрироваться в другие сервисы Google.

Также: ChatGPT против Bing Chat против Google Bard: Какой лучший AI-чатбот?

“Gemini – результат совместных усилий команд Google, включая наших коллег из Google Research”, – говорит Деннис Хассабис, генеральный директор и сооснователь Google DeepMind. “Он был создан с нуля для работы с несколькими режимами, что означает его способность обобщать и понимать, работать с различными типами информации, включая текст, код, аудио, изображения и видео”.

Кто создал Gemini?

Gemini был создан Google и Alphabet, материнской компанией Google, и выпущен как самая передовая модель искусственного интеллекта компании. Огромный вклад в разработку Gemini также внесла компания Google DeepMind.

Также: Bing’s new Deep Search uses GPT-4 to get you more thorough search results

Есть ли разные версии Gemini?

Google описывает Gemini как гибкую модель, которая способна работать как на серверах данных Google, так и на мобильных устройствах. Для этого масштабируемости Gemini выпущена в трех размерах: Gemini Nano, Gemini Pro и Gemini Ultra.

  • Gemini Nano: Размер модели Gemini Nano разработан для работы на смартфонах, в частности на Google Pixel 8. Он предназначен для выполнения задач на устройстве, не требующих подключения к внешним серверам, таких как предложение ответов в приложениях чатов или подведение итогов текста.
  • Gemini Pro: Работая на серверах данных Google, Gemini Pro разработан для питания последней версии чат-бота компании AI Bard. Он способен обеспечить быстрые времена ответа и понимать сложные запросы.
  • Gemini Ultra: Хотя она пока не доступна для широкого использования, Google описывает Gemini Ultra как свою самую мощную модель, превосходящую «современные лучшие результаты на 30 из 32 широко используемых академических тестах, используемых в исследованиях и разработке моделей моделирования большого объема данных (LLM)». Она предназначена для выполнения высоко сложных задач и будет выпущена после завершения текущей фазы тестирования.

Как можно получить доступ к Gemini?

Сейчас Gemini доступна в Google-продуктах в размерах Nano и Pro, таких как смартфон Pixel 8 и чат-бот Bard, соответственно. Google планирует постепенно интегрировать Gemini в свой поиск, рекламу, Chrome и другие сервисы.

Также: I asked DALL-E 3 to create a portrait of every US state, and the results were gloriously strange

Разработчики и корпоративные клиенты смогут получить доступ к Gemini Pro через Gemini API в AI Studio от Google и Google Cloud Vertex AI, начиная с 13 декабря. Разработчики Android получат доступ к Gemini Nano через AICore, который будет доступен на основе ранней предварительной версии.

Чем отличается Gemini от других моделей искусственного интеллекта, таких как GPT-4?

Новая модель Gemini от Google, по всей видимости, является одной из самых больших и передовых моделей искусственного интеллекта на сегодняшний день, но настоящим испытанием этого станет выпуск модели Ultra. По сравнению с другими популярными моделями, которые сейчас используются для работы чат-ботов на базе искусственного интеллекта, Gemini выделяется своей встроенной возможностью работать с различными модальностями, тогда как другие модели, такие как GPT-4, требуют использования плагинов и интеграций для полноценной работы с модальностями.

Также: Google говорит, что Bard теперь умнее ChatGPT благодаря обновлению Gemini

График сравнения от Google показывает, как Gemini Ultra и Pro сравниваются соответственно с GPT-4 и Whisper от OpenAI. 

По сравнению с GPT-4, преимущественно текстовой моделью, Gemini легко выполняет работу с разными модальностями. В то время как GPT-4 блестяще справляется с языковыми задачами, такими как создание контента и сложный текстовый анализ, для работы с изображениями и доступа к сети он полагается на плагины OpenAI, а для создания изображений и обработки аудио – на DALL-E 3 и Whisper.

Также: Лучшие чат-боты на базе искусственного интеллекта: ChatGPT и другие достойные альтернативы

Также стоит отметить, что Gemini от Google больше ориентирована на продукт, чем другие доступные модели. Она либо внедрена в экосистему компании, либо планируется внедрение, поскольку она использована для устройств Bard и Pixel 8. Другие модели, такие как GPT-4 и Llama от Meta, ориентированы на предоставление сервисов и доступны для множества сторонних разработчиков для применений, инструментов и услуг.