Что такое Gemini? Все, что вам следует знать о новой модели искусственного интеллекта Google
Что такое Gemini? Все, что нужно знать о новой модели искусственного интеллекта Google
![На ноутбуке отображается веб-сайт Google Gemini с надписью «Добро пожаловать в эру Gemini»](https://tech.miximages.com/www.zdnet.com/a/img/resize/609eee1b197cc861b323b8c24bd409e3604253b0/2023/12/06/aa9adc0c-ec53-4778-9a97-d5b072ee5a5a/geminiera.jpg?auto=webp&width=1280)
Что такое Google Gemini?
Gemini – это новая и мощная модель искусственного интеллекта от Google, которая способна понимать не только текст, но и изображения, видео и аудио. Как модель с несколькими режимами, Gemini описывается способностью выполнять сложные задачи в математике, физике и других областях, а также понимать и генерировать качественный код на разных языках программирования.
В настоящее время она доступна через интеграции с Google Bard и Google Pixel 8, а постепенно будет интегрироваться в другие сервисы Google.
Также: ChatGPT против Bing Chat против Google Bard: Какой лучший AI-чатбот?
“Gemini – результат совместных усилий команд Google, включая наших коллег из Google Research”, – говорит Деннис Хассабис, генеральный директор и сооснователь Google DeepMind. “Он был создан с нуля для работы с несколькими режимами, что означает его способность обобщать и понимать, работать с различными типами информации, включая текст, код, аудио, изображения и видео”.
Кто создал Gemini?
Gemini был создан Google и Alphabet, материнской компанией Google, и выпущен как самая передовая модель искусственного интеллекта компании. Огромный вклад в разработку Gemini также внесла компания Google DeepMind.
- «Как искусственный интеллект Gemini от Google делает ваш Pixel 8 Pr...
- Сейчас самый подходящий для большинства людей телевизор Samsung QLE...
- Женщины покупают больше автомобилей, так почему дизайн такой машини...
Также: Bing’s new Deep Search uses GPT-4 to get you more thorough search results
Есть ли разные версии Gemini?
Google описывает Gemini как гибкую модель, которая способна работать как на серверах данных Google, так и на мобильных устройствах. Для этого масштабируемости Gemini выпущена в трех размерах: Gemini Nano, Gemini Pro и Gemini Ultra.
- Gemini Nano: Размер модели Gemini Nano разработан для работы на смартфонах, в частности на Google Pixel 8. Он предназначен для выполнения задач на устройстве, не требующих подключения к внешним серверам, таких как предложение ответов в приложениях чатов или подведение итогов текста.
- Gemini Pro: Работая на серверах данных Google, Gemini Pro разработан для питания последней версии чат-бота компании AI Bard. Он способен обеспечить быстрые времена ответа и понимать сложные запросы.
- Gemini Ultra: Хотя она пока не доступна для широкого использования, Google описывает Gemini Ultra как свою самую мощную модель, превосходящую «современные лучшие результаты на 30 из 32 широко используемых академических тестах, используемых в исследованиях и разработке моделей моделирования большого объема данных (LLM)». Она предназначена для выполнения высоко сложных задач и будет выпущена после завершения текущей фазы тестирования.
Как можно получить доступ к Gemini?
Сейчас Gemini доступна в Google-продуктах в размерах Nano и Pro, таких как смартфон Pixel 8 и чат-бот Bard, соответственно. Google планирует постепенно интегрировать Gemini в свой поиск, рекламу, Chrome и другие сервисы.
Также: I asked DALL-E 3 to create a portrait of every US state, and the results were gloriously strange
Разработчики и корпоративные клиенты смогут получить доступ к Gemini Pro через Gemini API в AI Studio от Google и Google Cloud Vertex AI, начиная с 13 декабря. Разработчики Android получат доступ к Gemini Nano через AICore, который будет доступен на основе ранней предварительной версии.
Чем отличается Gemini от других моделей искусственного интеллекта, таких как GPT-4?
Новая модель Gemini от Google, по всей видимости, является одной из самых больших и передовых моделей искусственного интеллекта на сегодняшний день, но настоящим испытанием этого станет выпуск модели Ultra. По сравнению с другими популярными моделями, которые сейчас используются для работы чат-ботов на базе искусственного интеллекта, Gemini выделяется своей встроенной возможностью работать с различными модальностями, тогда как другие модели, такие как GPT-4, требуют использования плагинов и интеграций для полноценной работы с модальностями.
Также: Google говорит, что Bard теперь умнее ChatGPT благодаря обновлению Gemini
График сравнения от Google показывает, как Gemini Ultra и Pro сравниваются соответственно с GPT-4 и Whisper от OpenAI.
По сравнению с GPT-4, преимущественно текстовой моделью, Gemini легко выполняет работу с разными модальностями. В то время как GPT-4 блестяще справляется с языковыми задачами, такими как создание контента и сложный текстовый анализ, для работы с изображениями и доступа к сети он полагается на плагины OpenAI, а для создания изображений и обработки аудио – на DALL-E 3 и Whisper.
Также: Лучшие чат-боты на базе искусственного интеллекта: ChatGPT и другие достойные альтернативы
Также стоит отметить, что Gemini от Google больше ориентирована на продукт, чем другие доступные модели. Она либо внедрена в экосистему компании, либо планируется внедрение, поскольку она использована для устройств Bard и Pixel 8. Другие модели, такие как GPT-4 и Llama от Meta, ориентированы на предоставление сервисов и доступны для множества сторонних разработчиков для применений, инструментов и услуг.