Закрыто для перевода ИИ-чатботы мыслят по-английски
Первоначальное исследование показывает, что самые большие чатботы искусственного интеллекта могут иметь значительные предубеждения в отношении английского языка.
“`html
Исследования показывают, что искусственный интеллект в основном использует английский язык для своих когнитивных процессов.
А задумывались ли вы когда-нибудь о том, на каком языке “думают” чатботы на искусственном интеллекте (ИИ)? 🤔 Новые исследования показывают, что эти языковые модели настроены “думать” на английском, даже когда задают им вопросы на других языках. Как будто у них есть внутреннее английское пространство, обрабатывающее всё на их родном языке, независимо от языка, на котором им представлены вопросы. 🌍
Оглянемся за кулисами
Чтобы разгадать тайну, исследователи из Швейцарского федерального института технологий в Лозанне решили приоткрыть занавес и ближе рассмотреть эти модели чатботов на ИИ. Они хотели понять внутренние механизмы этих больших языковых моделей и как они обрабатывают разные языки.
“Мы открыли эти модели и посмотрели на каждый из слоёв,” пояснил исследователь Вениамин Веселовский. “Мы хотели увидеть, можем ли мы наблюдать, что внутренние слои действительно обрабатывают информацию на английском языке?” 🤓
Многоязычное меню
Исследовательская группа выбрала три открытые модели чатботов на ИИ для своего исследования. Эти модели были протестированы с использованием подсказок на четырех разных языках: французском, немецком, русском и китайском. Подсказки имели три вариации:
- Инстаграм успешно имитирует ТикТок.
- Получите Microsoft Office Professional для Mac или ПК всего за $56 ...
- Разблокируйте свой потенциал развития с Microsoft Visual Studio Pro...
- Повторите данное слово
- Переведите из одного нелатинского слова в другое
- Заполните пропуск одним словом в предложении
Анализируя слои обработки в чатботах на ИИ, исследователи смогли проследить путь, который проходила каждая подсказка. И что они обнаружили? 🕵️♀️
Обход английского подпространства
Оказалось, что эти чатботы на ИИ делают обход через то, что исследователи назвали “английским подпространством.” Вместо прямого перевода с одного языка на другой, например, с французского на немецкий, чатботы на ИИ сначала переводят с французского на английский, а затем с английского на немецкий (или наоборот).
Почему это важно? По мнению Веселовского, это подтверждает, что эти языковые модели полагаются на английский язык как на мост, чтобы понимать определенные концепции. 😮
От перевода не осталось и следа
Хотя предпочтение чатботов к английскому языку может показаться незначительным, это вызывает опасения относительно однородности развития ИИ. Исследовательница Алия Бхатия из Центра демократии и технологий в Вашингтоне выразила беспокойство по поводу растущей зависимости от данных на английском языке для обучения моделей ИИ.
“Для обучения моделей доступно больше высококачественных данных на английском и нескольких языках ООН, чем на большинстве других языков,” пояснила Бхатия. “Это рискует навязыванием ограниченного мирового взгляда на другие лингвистически и культурно отличные регионы.” 🌐
Что нам готовит будущее?
По мере того, как развивается ИИ, важно задавать вопросы о языковом разнообразии и культурной инклюзивности. Полагаться на английский язык в качестве посредника для моделей ИИ может укреплять предубеждения и ограничивать доступ к выгодам ИИ для неговорящих на английском языках.
Хотя продвижения происходят в обучении моделей ИИ с мультиязычными данными, еще много работы предстоит сделать. Исследователи и разработчики должны придавать важность языковому и культурному разнообразию, чтобы гарантировать, что технологии ИИ действительно инклюзивны. 🌍
Вопросы и ответы
Q: Могут ли чатботы на ИИ научиться “думать” на других языках, кроме английского? A: Да, чатботы на ИИ могут научиться “думать” на нескольких языках, но на данный момент они часто полагаются на английский язык как на мост для понимания различных концепций на разных языках.
Q: Является ли предпочтение английского языка в моделях ИИ следствием ограниченности данных для обучения на других языках? A: Да, одной из причин, почему модели ИИ часто полагаются на английский, является изобилие высококачественных данных на английском по сравнению с другими языками. Разработчики часто обучают модели в основном на данных на английском языке.
Q: Каковы потенциальные последствия того, что модели ИИ в основном “думают” на английском? A: Полагание на английский язык в качестве посредника создает риск наложения ограниченного мировоззрения на лингвистически и культурно отличные регионы. Это может усиливать предвзятости и затруднять развитие технологий ИИ, учитывающих разнообразие культур и языков.
Ссылки
- Протестировано: чатбот Google Gemini
- Хотите стать специалистом по обработке данных?
- Источник изображения: Иероглиф
“““html
Что вы думаете о доминировании английского языка в мышлении ИИ-чатботов? Начнем разговор! Поделитесь своими мыслями в комментариях ниже и не забудьте нажать эту кнопку “Поделиться”, чтобы распространить информацию. 👇🗣️💻
“`