Meta только что выпустила кодовую версию Llama 2

Meta выпустила кодовую версию Llama 2

Когда Meta выпустила Llama 2, мощную модель искусственного интеллекта, аналогичную той, что находится за ChatGPT, в прошлом месяце, она позволила разработчикам, стартапам и исследователям играть с тем самым искусственным интеллектом, который завораживает мир уже почти год.

Сегодня Meta выпускает Code Llama, версию модели, настроенную для программирования. Это может означать, что больше разработчиков попробуют AI-помощь при написании кода. Это также может вдохновить на создание новых способов внедрения AI в программное обеспечение. И это может помочь Meta еще больше утвердиться в качестве ведущего поставщика “открытых” инструментов AI.

“Это волнующе, что они передают веса сообществу”, – говорит Дипак Кумар, постдокторант из Стэнфорда, изучавший AI-программирование, относительно параметров нейронной сети, лежащих в основе модели.

Кумар говорит, что выпуск обычной языковой модели Llama 2 Meta привел к созданию сообществ, посвященных обсуждению ее поведения и возможности ее изменения. “Это дает нам некоторую гибкость, чтобы поиграть с тем, что происходит внутри, по сравнению с этими закрытыми моделями от Google или OpenAI”, – добавляет Кумар.

Кумар говорит, что разработчики, скорее всего, создадут новые виды приложений с использованием Code Llama. Например, могла бы быть создана помощница по программированию, которая выполняет различные дополнительные проверки безопасности перед рекомендацией фрагмента кода, говорит Кумар, который в своих исследованиях исследовал, как AI-помощь иногда может привести к менее безопасному коду. Кумар добавляет, что выпуск может вдохновить создание помощников, специализированных для конкретных видов программирования. “Вы можете создавать все виды инструментов на основе модели”, – говорит он.

Талия Рингер, ассистент профессора Университета Иллинойса в Урбана-Шампейне, занимающаяся исследованиями в области программирования, говорит, что Code Llama будет ценным для научных исследований. “У меня уже есть студенты, использующие модели Llama для исследований, и я могу представить, что эти студенты будут особенно заинтересованы в модели для кода, учитывая характер нашей работы”, – говорит она. Однако Рингер добавляет, что в идеале также были бы опубликованы данные, использованные для обучения. “Это часто пропущенный элемент для осмысления исследований по LLM”, – говорит она.

Программирование – это область, в которой недавние достижения в области AI уже оказали значительное влияние.

В мае 2021 года GitHub, дочерняя компания Microsoft, запустила Copilot, плагин для программирования, автоматически дополняющий куски кода на основе первой строки или комментария, введенного пользователем. Copilot использует версию GPT от Open AI, большую языковую модель, лежащую в основе ChatGPT. Эта модель дополнительно обучается с использованием кода, который GitHub хранит для разработчиков, а также, предположительно, с помощью контрактных сотрудников, которые получают оплату за аннотирование своего собственного кода.

GitHub столкнулся с судебным иском из-за использования некоторого кода с открытым исходным кодом в своих обучающих данных, и Масад говорит, что Meta, вероятно, ограничила обучающие данные, чтобы избежать таких осложнений. Copilot стоит 10 долларов в месяц для физических лиц и 19 долларов в месяц на одного пользователя для компаний.

Copilot, по-видимому, пользуется популярностью среди разработчиков. Согласно данным, опубликованным GitHub в июне, им пользуется более миллиона разработчиков и более 200 тысяч компаний. Собственные исследования компании также показывают, что Copilot ускоряет скорость выполнения задач программистами, что приводит к увеличению производительности на 30 процентов.

Meta выпускает две версии Code Llama, одну для создания кода на Python и другую, оптимизированную для превращения естественноязыковых команд в код. Также доступны три размера моделей. Самая маленькая может работать на одном графическом процессоре.

Meta говорит, что Code Llama обучена на коде, находящемся в общественном достоянии. По результатам двух распространенных бенчмарков по программированию, HumanEval и Mostly Basic Python Problems, она показывает гораздо лучшие результаты по сравнению с существующими моделями кодирования с открытым исходным кодом и “находится на уровне ChatGPT”, – говорит компания.

Амджад Масад, генеральный директор Replit, онлайн-платформы для программирования, предлагающей несколько инструментов генеративного AI, не ожидает, что Code Llama заменит Copilot, потому что ее ограниченные данные обучения, скорее всего, сделают ее менее функциональной. Но он говорит, что выпуск может позволить разработчикам экспериментировать с агентами, выполняющими полезные задачи, такие как поиск информации в Интернете или использование API для бронирования полетов или заказа еды. “Я думаю, что это действительно интересная область”, – говорит Масад. “Взаимодействия, где вы можете вводить команды на естественном языке, и модель может обрабатывать данные, могут делать интересные вещи в мире”.

Выпуск Code Llama также может принести пользу Meta. У компании может не быть ChatGPT или AI-приводимого поисковика, но утверждение себя в качестве поставщика бесплатного AI для многих разработчиков, компаний и исследователей может дать ей преимущество в гонке за использование генеративного AI. Meta решила принять открытый подход после того, как в мае кто-то утекла ранняя версия Llama в Интернет.

Ни Llama 2, ни Code Llama не являются свободно распространяемыми программными лицензиями, которые позволяют неограниченное коммерческое использование. Например, по лицензии Meta пользователи ограничены в использовании моделей в приложениях или сервисах с более чем 700 миллионами ежемесячных пользователей.

Научная статья, опубликованная в этом месяце, отмечает, что выпуск AI-инструментов может иметь значительные непрямые преимущества для компаний, стоящих за ними, блокируя исследователей в использовании их инструментов, например, и предоставляя им новые идеи, которые они могут использовать в масштабе.