Cerebras и Abu Dhabi’s M42 создали юрисдикцию LLM, посвященную ответам на медицинские вопросы

Cerebras и Abu Dhabi's M42 формируют правовую сферу LLM, освещающую решения в области медицины

Логотип Cerebras и M42

Применение искусственного интеллекта в здравоохранении является обширным. Однако оно в основном контролируется более старыми технологиями искусственного интеллекта. Новые вещи, такие как так называемый генеративный искусственный интеллект и большие языковые модели (БЯМ), сейчас очень популярны, но их считают слишком рискованными для широкого использования в здравоохранении из-за чувствительности здравоохранения, как недавно сообщил ENBLE пресс-центр.

Усилия в области открытого программного обеспечения могут помочь в развитии генеративного искусственного интеллекта, позволив посмотреть “внутрь черного ящика” искусственного интеллекта по сравнению с закрытыми программами, такими как ChatGPT от OpenAI (IM-нейронка).

Также: Как работает ChatGPT на самом деле?

В этом духе производитель компьютеров с искусственным интеллектом Cerebras Systems на прошлой неделе объявил о совместном проекте с партнером M42, оператором медицинских учреждений в 27 странах, для предоставления открытой БЯМ, разработанной для здравоохранения, в качестве “помощника” для медицинских работников.

Программа под названием Med42 является усовершенствованием Llama 2, открытой БЯМ, выпущенной Meta Properties в этом году, с использованием специального набора данных, собранного компаниями в области здравоохранения.

“Она проложила путь в использовании искусственного интеллекта в области здравоохранения”, – сказал сооснователь и генеральный директор Cerebras Эндрю Фелдман в интервью для ENBLE.

Также: 3 способа, как искусственный интеллект революционизирует обслуживание пациентов здравоохранения. Могут ли БЯМ, такие как ChatGPT, помочь?

Среди приложений программы в качестве помощника врачей – ответы на медицинские вопросы, суммирование медицинских записей, помощь в медицинском диагнозе и ответы на общие вопросы о здоровье, говорят компании. Они подчеркивают, что она не включает обучение врачей.

Для Med42 была использована 70-миллиардная версия Llama 2. Регулирование производилось Cerebras и M42 в сотрудничестве с компанией Core42, занимающейся управляемыми услугами и исследованиями в области информационных технологий. Sуть дела в том, что и M42, и Core42 принадлежат клиенту Cerebras – глобальной корпорации G42.

Нейронная сеть Med42 была настроена с использованием набора данных из 700 000 пар вопрос-ответ из общедоступных источников, “который был подобран M42 и проверен нашей командой медицинских экспертов”, – сказал M42 в письме ENBLE. “Набор данных включал вопросы с выбором ответа, медицинские карточки и другие”, – отметил он.

“Med42 не была обучена с использованием данных пациентов или идентифицируемой информации”, – сказал M42.

Код M42 теперь доступен на HuggingFace, вместе с данными о производительности. Компании планируют выпускать дополнения, поскольку они “совершенствуют и тестируют модель совместно” с медицинскими специалистами “для улучшения ее возможностей и производительности”. На вопрос о том, будет ли сам набор данных опубликован, компании сообщили ENBLE в электронной почте: “Это еще предстоит определить”.

Также: Microsoft представляет расширения для Fabric, Azure для медицинского ИИ

Тонкая настройка была выполнена на Condor Galaxy, огромном компьютере искусственного интеллекта, которым Cerebras оснастили G42 в этом году, который компания Cerebras называет «самым большим суперкомпьютером в мире для искусственного интеллекта». По словам представителей компании Cerebras, «Быстрая настройка и сокращение времени обучения стали возможными благодаря 82 терабайтам памяти и 54 миллионам ядер искусственного интеллекта в 64 системах Cerebras CS-2 внутри CG-1».

«Вы можете заметить, что на Condor Galaxy запускаются все эти интересные приложения, и такого аппаратного обеспечения нет у других стартапов», – сказал Фельдман. «Мы действительно продвигаем отрасль вперед».

Фельдман отметил в последующем электронном письме, что «Все параметры Llama 2 были настроены, и это стало возможным благодаря огромной доступной памяти на Condor Galaxy 1 […]. Настройка и обучение на протяжении 3 эпох заняли 5 дней, что для больших кластеров графических процессоров заняло бы месяцы».

В данных о производительности на HuggingFace компании отмечают, что «Med42 достигает высоких результатов на различных медицинских бенчмарках, включая MedQA, MedMCQA, PubMedQA, HeadQA и более широкую тематику Measuring Massive Multitask Language Understanding (MMLU) в области клинической медицины».

Кроме того: Что такое HuggingChat? Все, что нужно знать об этом открытом искусственном интеллекте для чат-ботов

В рамках пробного экзамена USMLE (экзамен по медицинской лицензии США) программа, по словам компании M42, «достигает точности 72%», что лучше предыдущих результатов среди открытых медицинских LLM. Она также превосходит закрытую модель GPT 3.5 от OpenAI, которая показала точность 59,6%, хотя Med42 уступает точности модели GPT-4, составившей 84,3%.

«Если взять очень большую предварительно обученную модель, такую как Llama 2 70 миллиардов, и подать на нее действительно интересные наборы данных, прорывные наборы данных, они могут продемонстрировать самые интересные вещи, и при этом затратив гораздо меньше времени и энергии, чем GPT 3.5», – сказал Фельдман.

Cerebras в последнее время особенно активна в проектах с открытым исходным кодом. В марте компания опубликовала несколько версий программ искусственного интеллекта в качестве открытых исходных кодов, чтобы их можно было использовать без ограничений.

В августе компания представила самую мощную в мире арабоязычную LLM-модель Jais-Chat в качестве открытой программы.

Кроме того: Cerebras и Абу-Даби создали самую мощную арабоязычную модель искусственного интеллекта

На данный момент Med42 еще не проходит в производство. Как сообщают компании в письме ENBLE: «После успешного тестирования Med42 будет доступна для клинического применения». Они также добавили: «Особую важность мы придаем безопасному применению технологии перед скоростью ее производства и привержены тщательной оценке модели исходной безопасности перед введением ее в эксплуатацию».