Сингапур возглавляет инициативу по разработке многомодальной языковой модели для Юго-Восточной Азии.

Сингапур инвестирует $52 млн в разработку уникальной языковой модели, отличающейся от западных стран.

Исследовательский проект создает большую модель искусственного интеллекта для Юго-Восточной Азии

🌐 Globe of Southeast Asia 🌐

Под руководством Сингапура начат новый исследовательский проект по созданию большой языковой модели (LLM) для лучшего соответствия демографической структуре стран Юго-Восточной Азии.

Представление национальной многомодальной программы LLM

Определенная национальная многомодальная программа LLM была запущена Сингапуром с целью разработки большой языковой модели искусственного интеллекта, которая поддерживает разнообразие культуры и языка региона. 🇸🇬

Три государственных агентства – Управление развитием инфокоммуникаций и медиа (IMDA), агенство AI Singapore (AISG) и Агентство здравоохранения, науки, технологий и исследований (A*STAR) – сотрудничают в запуске исследовательской программы, финансирование которой составляет 70 миллионов сингапурских долларов (52,48 миллиона долларов США) от Национального научного фонда.

Почему Юго-Восточной Азии нужны местные языковые модели

“В условиях быстрого развития технологий стратегической необходимостью является развитие суверенных возможностей в LLM”, – говорится в совместном заявлении агентств. “Сингапур и местная и региональная культуры, ценности и нормы отличаются от западных стран, откуда исходят большинство больших языковых моделей”.

Для достоверного понимания контекста и ценностей, связанных с разнообразием культур и языков региона, важно разрабатывать многомодальные и местные языковые модели LLM для Юго-Восточной Азии. Это включает решение проблем контекстного переключения между языками в многоязычном населении Сингапура.

Создание исследовательских и инженерных возможностей

Исследовательская программа будет использовать высокопроизводительные вычислительные ресурсы Национального центра суперкомпьютеров Сингапура и сосредоточится на развитии исследовательских и инженерных возможностей страны в области многомодальных языковых моделей LLM. Планы Сингапура стать мировым центром искусственного интеллекта очевидны. Он хочет создать условия для индустриального сотрудничества за границами и стимулировать следующую волну инноваций в области искусственного интеллекта, инвестируя в таланты и большие языковые модели искусственного интеллекта для региональных языков.

SEA-LION: Шаг к большей локализации

Эта инициатива будет развиваться на основе усилий Юго-Восточной Азии по созданию открытой многомодальной языковой модели SEA-LION (Southeast Asian Languages in One Network), которая является более компактной, гибкой и быстрой по сравнению с доступными на рынке моделями LLM. SEA-LION работает на базе двух моделей: модели с тремя миллиардами параметров и модели с семью миллиардами параметров.

Создавая LLM, более точно отражающие население “non-WEIRD” (не-западное, образованное, индустриализованное, богатое, демократическое), SEA-LION стремится преодолеть существующие предубеждения. Благодаря своим тренировочным данным, состоящим из 981 миллиарда языковых токенов, SEA-LION имеет потенциал для заполнения пробела и предоставления более точного представления юго-восточно-азиатских языков и культур.

Амбициозная стратегия Сингапура в области искусственного интеллекта

Усилия по созданию локализованных LLM соответствуют стратегии Сингапура в области искусственного интеллекта, которая нацелена на установление страны в качестве глобального центра разработки AI-решений к 2030 году. В рамках этой всесторонней стратегии предусмотрены планы по утроению числа специалистов по искусственному интеллекту в стране до 15 000 человек за следующие три пять лет, а также инициативы в области управления, тестирования, бенчмаркинга, а также этики и безопасности AI.

Заместитель премьер-министра Сингапура Лоуренс Вонг подчеркнул важность ответственного развития и внедрения искусственного интеллекта в своем заявлении при запуске национальной стратегии искусственного интеллекта. По мере развития искусственного интеллекта, он отметил возможность появления машин с когнитивными способностями похожими на человека, самосознанием и самостоятельным принятием решений. Поэтому важно наставлять развитие и внедрение искусственного интеллекта осознанно.

Вопросы и ответы: Что еще хотят знать читатели?

Вопрос: Что такое большая языковая модель (LLM)? Ответ: Большая языковая модель – это система искусственного интеллекта, способная генерировать текст, отвечать на вопросы и понимать контекст языка, имея в своем распоряжении огромное количество данных для изучения и имитации языковых шаблонов, близких к человеческим.

Вопрос: Как существующие языковые модели проявляют предубеждение? Ответ: Существующие языковые модели часто проявляют предубеждение из-за данных, на которых они обучаются, которые часто берутся из интернета. Эти данные обладают западным, образованным, индустриализованным, богатым, демократическим (WEIRD) происхождением, что создает предубеждения в культурных ценностях, политических убеждениях и социальных отношениях. Люди, не относящиеся к WEIRD, менее представлены в этих моделях.

Вопрос: Каковы преимущества создания локализованных языковых моделей? Ответ: Создание локализованных языковых моделей позволяет лучше понять нюансы, культурный контекст и ценности, специфичные для конкретного региона. Решая проблемы предубеждений и ограничений существующих моделей, локализованные модели предоставляют более точные представления и обеспечивают прогресс в приложениях искусственного интеллекта для региональных языков.

Вопрос: Чем SEA-LION способствует локализации языка? Ответ: SEA-LION – это открытая модель LLM, специально разработанная для представления непривычных популяций. Используя свои тренировочные данные, включающие языковые токены из Юго-Восточной Азии и регионов с китайским языком, SEA-LION стремится предоставить более всеобъемлющую и комплексную языковую модель для культур Юго-Восточной Азии.

Вопрос: Каковы долгосрочные последствия стратегии ИИ в Сингапуре? Ответ: Стратегия ИИ в Сингапуре нацелена на позиционирование страны как мирового лидера в области разработки ИИ. Содействуя сотрудничеству в сфере промышленности, увеличению числа профессионалов в области ИИ и акцентируя внимание на правопорядке и этике, Сингапур стремится стимулировать инновации, экономический рост и социальный прогресс в области ИИ.

В заключение

Национальная мультимодальная программа LLM, реализуемая Сингапуром, демонстрирует приверженность разработке языковых моделей ИИ, лучше представляющих культуры и языки Юго-Восточной Азии. Решая проблемы предубеждений, контекста специфичного для языка и местальных ценностей, эти локализованные модели проложат путь для прогресса в приложениях ИИ и способствуют инновациям в регионе. Амбициозная стратегия ИИ в Сингапуре позиционирует страну как мирового лидера в разработке ИИ, подчеркивая важность ответственного принятия ИИ и необходимость принятия преобразующей силы ИИ.


Ссылки:
1. TomTom and Microsoft Launching AI Driving Assistant 2. The Ethics of Generative AI: How We Can Harness This Powerful Technology 3. DALL·E 3: How ChatGPT Can Read and Modify Images, Come See 4. A Thorny Question: Who Owns Code, Images, and Narratives Generated by AI? 5. CBS Paramount Owner National Amusements Says Hacked 6. OpenAI Releases ChatGPT Data Leak Patch: Issue Completely Fixed 7. 7 Advanced ChatGPT Prompt-Writing Tips You Need to Know


Этот статья вам понравилась? Поделитесь своими мыслями в комментариях ниже и не забудьте распространить эту статью ваших любимых социальных медиа-платформах! 🚀😄