Открытый исходный код против закрытого исходного кода развязка битвы искусственного интеллекта

Исследователи обнаружили, что Лама 2 показала лишь незначительно лучшие результаты, чем случайное угадывание, в медицинском экзамене, тогда как GPT-4 почти достигла проходного балла.

Открытые исходные коды генеративных моделей искусственного интеллекта все еще отстают от GPT-4

Источник изображения: MixImages – tech

Один из самых горячих споров в мире генеративного искусственного интеллекта (ИИ) вращается вокруг продолжающейся риторики между моделями с открытым и закрытым исходным кодом. У обеих сторон есть свои сторонники и критики, но какой подход обещает больше всего в доставке ценных решений в области ИИ? Давайте погрузимся в захватывающий и безжалостный мир ИИ и узнаем!

Столкновение титанов: модели с открытым и закрытым исходным кодом языка

В углу с открытым исходным кодом у нас есть множество больших языковых моделей (БЯМ), постоянно разрабатываемых живым сообществом авторов. Лидером является впечатляющая модель Лама 2 с открытым исходным кодом, которая привлекла значительное внимание.

В закрытом исходном коде представлены мощные конкуренты: GPT-4 от OpenAI и языковая модель стартапа с венчурным финансированием Anthropic, известная как Claude 2.

🔗 Соответствующая ссылка: Walmart представляет генеративный ИИ на CES

Ключ к победе: производительность в определенных областях

Чтобы определить, какой подход является высшим, давайте изучим их производительность в определенных областях. Возьмем, например, сложную область нефрологии, науки о почках. В недавнем исследовании, проведенном учеными университетов Пеппердайн, Калифорния в Лос-Анджелесе и Калифорния в Риверсайде (опубликовано в NEJM AI), модели с открытым исходным кодом запнулись, в то время как GPT-4 продемонстрировал свое мастерство.

🔗 Соответствующая ссылка: Потребность предприятий в управлении ИИ

«По сравнению с GPT-4 и Claude 2 модели с открытым исходным кодом показали плохие результаты по общей правильности ответов и качеству их объяснений», пишет главный автор Шон Ву и его коллеги.

🔗 Соответствующая ссылка: Лучшие искусственные интеллектуальные чатботы

GPT-4 действительно выделяется, достигая результата в 73,3% – почти на уровне проходного балла для человека, отвечающего на вопросы нефрологии с выбором из нескольких вариантов.

Результаты битвы: модели с открытым исходным кодом трудно догнать

К сожалению, модели с открытым исходным кодом, включая Лама 2, подвели, когда речь зашла о предоставлении точных ответов. Они достигли результатов, которые не лучше случайного угадывания. Тем не менее, Лама 2 смогла незначительно превзойти своих коллег с открытым кодом, набрав 30,6%.

🔗 Соответствующая ссылка: Пять способов ответственного использования ИИ

Основные факторы: собственные медицинские данные в центре внимания

Множество причин приводят к неудовлетворительной производительности моделей с открытым исходным кодом. Особенно Anthropic и OpenAI интегрировали собственные медицинские данные в свои процессы обучения, что дает им явное преимущество.

🔗 Соответствующая ссылка: MedPerf стремится ускорить медицинский ИИ, сохраняя данные конфиденциальными

Ведущий автор, Шон Ву, и его команда отметили, что «высококачественные данные для обучения БЯМ в медицинской области часто находятся в неопубликованной литературе». Эти данные, состоящие из отобранных и рецензируемых источников, таких как учебники и статьи, остаются недоступными для сообщества с открытым исходным кодом. Доступ к таким исключительным медицинским данным для обучения, скорее всего, будет значительным фактором, определяющим улучшение моделей с открытым исходным кодом в будущем.

🔗 Соответствующая ссылка: Обновление: телефоны Google Pixel

Есть куда расти: Долгий путь вперед

Хотя успех GPT-4 был похвальным, важно помнить, что даже он не смог достичь оценки человека. Все языковые модели, независимо от их открытости, имеют еще долгий путь вперед. Но не беспокойтесь, на горизонте есть инициативы, которые могут уравнять поле.

Федерированное обучение: Умное будущее

Одно из трансформационных усилий, набирающих обороты, – это федеративное обучение, при котором языковые модели обучаются на частных данных, а затем вносят свои знания в совместное усилие в облачном хранилище. Этот подход направлен на сокращение разрыва между конфиденциальными медицинскими данными и коллективным движением по укреплению моделей с открытым исходным кодом. Примечательной инициативой в этой области является MedPerf, инициированная консорциумом индустрии ML Commons.

🔗 Ссылка на материал: Apple посвящает огромное количество времени и усилий искусственному интеллекту

Разблокировка мощи сотрудничества

Еще один многообещающий подход – потенциальное перенос коммерческих моделей в программы с открытым исходным кодом. Получив конкретные медицинские компетенции от своих родительских моделей, эти программы с открытым исходным кодом могут предоставить улучшенные результаты. MedPaLM, специализирующаяся на ответах на медицинские вопросы, модель LLM Google DeepMind, является замечательным примером.

🔗 Ссылка на материал: Курсы по изображению с использованием AI на Udemy

Когда миры сталкиваются: Усиление выводов для максимального воздействия

Даже без конкретной медицинской подготовки языковые модели могут достичь улучшенных результатов с использованием “поисково-улучшенной генерации”. Этот подход позволяет LLM искать внешний вход при формировании выводов, что усиливает возможности нейронных сетей.

Преимущество открытости: Коллаборативная креативность

В конечном счете, открытый характер моделей, таких как Llama 2, предлагает безграничные возможности для разных заинтересованных сторон внести свой вклад и улучшить. В отличие от моделей с закрытым исходным кодом, таких как GPT-4 и Claude 2, судьба моделей с открытым исходным кодом остается по-настоящему демократической.

Готовьтесь к битве за лидерство в области искусственного интеллекта, где инновации, креативность и сотрудничество проложат путь к превосходным языковым моделям!

🎉 Продолжаем обсуждение! Поделитесь своими мыслями о дебатах между открытым и закрытым исходным кодом в комментариях ниже. И не забудьте поделиться этой статьей в социальных сетях! 📢

Список литературы:

  1. Walmart представляет генеративный AI на выставке CES
  2. Потребность предприятий в управлении AI
  3. Лучшие AI-чат-боты
  4. Пять способов ответственного использования AI
  5. MedPerf стремится ускорить медицинский AI, при этом сохраняя конфиденциальность данных
  6. Обновление: телефоны Google Pixel
  7. Apple посвящает огромное количество времени и усилий искусственному интеллекту
  8. Курсы по изображению с использованием AI на Udemy