AI2 выпускает открытые языковые модели для свободного использования и исследований.

Научный институт искусственного интеллекта AI2 в недавнее время предоставил общественности несколько моделей генерации текста и соответствующих наборов данных для тренировки в открытом доступе.

AI2 выпустила открытые модели искусственного интеллекта, генерирующие текст, наряду с обучающими данными. Это хорошие новости для ENBLE!

Институт искусственного интеллекта Аллена (AI2), основанный поздним соучредителем Microsoft Полом Алленом, сделал прорывной шаг, выпустив серию языковых моделей, которые более “открытые” по сравнению с другими в этой области. Эти модели, называемые OLMo (Open Language MOdels), доступны не только для использования разработчиками, но также могут использоваться для обучения, экспериментирования и даже коммерциализации. Что делает их по-настоящему уникальными, так это их лицензирование, которое позволяет использовать их без ограничений, типично налагаемых другими моделями на рынке.

По словам Дирка Груневельда, старшего программного инженера в AI2, OLMo и его сопровождающий набор данных Dolma были разработаны для исследования высокоуровневой науки, на которой основана разработка текстогенерирующего искусственного интеллекта. Модели были обучены на Dolma, которая является одним из крупнейших общедоступных наборов данных такого рода. AI2 ожидает, что исследователи и практики будут использовать каркас OLMo в качестве возможности для анализа модели, обученной на таком обширном наборе данных.

🤓 Улучшение открытости языковых моделей

Открытые модели генерации текста стали всё более распространенными, поскольку компании, такие как Meta и Mistral, выпускают высококапабельные модели для использования и доработки разработчиками. Однако Груневельд утверждает, что многие из этих моделей не могут быть считаны по-настоящему открытыми из-за того, что обучение проводится “за закрытыми дверьми” и на непрозрачных проприетарных наборах данных.

В отличие от этого, модели OLMo были разработаны в сотрудничестве с Гарвардским университетом, AMD и Databricks и поставляются с всем необходимым кодом, обучающими данными и метриками оценки. Такая прозрачность отличает их от других моделей в индустрии.

🏆 Производительность и возможности OLMo

Самая продвинутая модель OLMo, OLMo 7B, является убедительной альтернативой Llama 2 от Meta, в зависимости от конкретного применения. В то время как OLMo 7B превосходит Llama 2 в бенчмарках по пониманию содержания, он немного отстает в тестах на ответы на вопросы. Тем не менее, важно отметить, что эти модели находятся на ранних стадиях разработки, и непрерывные улучшения вполне возможны.

Страшно отметить, что у моделей OLMo есть свои ограничения. Они производят низкокачественные результаты на языках, отличных от английского, поскольку Dolma в основном содержит контент на английском языке. Кроме того, их возможности по генерации кода относительно слабые. Однако Груневельд подчеркивает, что разработка OLMo все еще продолжается и будут продолжаться улучшения.

🌐 Будущее OLMo и видение AI2

Хотя OLMo в настоящее время сосредоточен на тексте на английском языке, AI2 планирует расширить его возможности. В ближайшие месяцы они намерены выпустить более крупные и более продвинутые модели OLMo, включая мультимодальные модели, способные понимать модальности, выходящие за пределы текста. Они также работают над дополнительными наборами данных для целей обучения и доработки. Все эти ресурсы, включая исходные OLMo и Dolma, будут свободно доступны на GitHub и Hugging Face, платформе для размещения проектов искусственного интеллекта.

Вопросы и ответы:

В: Могу ли я использовать модели OLMo коммерчески? О: Да, модели OLMo могут использоваться в коммерческих целях без каких-либо ограничений. Лицензирование AI2 позволяет использовать их без ограничений, делая их подходящими для коммерческих приложений.

В: Могут ли модели OLMo подвергаться злоупотреблению со стороны злоумышленников? О: Хотя существует возможность злоупотребления, Груневельд считает, что преимущества перевешивают риски. Открытый характер моделей OLMo способствует исследованию потенциальных опасностей и помогает выявлять способы их преодоления и исправления.

В: Какие планы на будущее у OLMo? О: AI2 намерена расширить возможности OLMo, выпустив более крупные и более продвинутые модели, включая мультимодальные модели. Они также предоставят дополнительные наборы данных для обучения и доработки.

🔍 Анализ влияния и будущих разработок

Выпуск открытых языковых моделей AI2 предоставляет исследователям и разработчикам беспрецедентную возможность изучать и развивать область текстогенерирующего искусственного интеллекта. Прозрачность и доступность этих моделей открывают путь к этическому развитию и равноправному доступу к технологиям искусственного интеллекта.

По мере развития использования языковых моделей необходимо уделять внимание проблемам, связанным с возможным злоупотреблением, таким как генерация токсичного или вредоносного контента. Тем не менее, преимущества открытых моделей в плане исследований и технологических прогрессов превышают эти заботы.

Путем предоставления доступа к полным наборам данных и обеспечения прозрачности в обучении моделей AI2 способствует инновациям и позволяет исследователям выявлять потенциальные опасности и находить способы их смягчения. Будущее OLMo и подобных моделей открытого языка обещает более равный доступ к технологии искусственного интеллекта, одновременно способствуя ответственному и этичному использованию.

💡 Дополнительное чтение

Если вы хотите узнать больше о области искусственного интеллекта, генерирующего текст, вам могут быть интересны следующие ресурсы:

  1. Meta Faces еще одну проблему с конфиденциальностью в ЕС – выбор оплаты конфиденциальности – TechCrunch
  2. Mistral – модели языка с открытым исходным кодом
  3. Подробнее о Dolma: одном из крупнейших общественных наборов данных
  4. Узнайте о Llama 2 – модели, разработанной Meta
  5. Откройте для себя Dolly – модель генерации открытого текста, созданная Databricks
  6. Проект ретрансляции дезинформации Democracy Reporting International

Теперь ваша очередь! Поделитесь своими мыслями об открытых языковых моделях AI2. Какое воздействие они, на ваш взгляд, окажут? 🤖💬

Примечание: Вышеупомянутая статья является улучшением и восстановлением информации, изначально опубликованной ENBLE. Контент был переписан, проанализирован и обновлен на основе профессионального анализа области компьютерных технологий и программирования.