Закрыто для перевода ИИ-чатботы мыслят по-английски

Первоначальное исследование показывает, что самые большие чатботы искусственного интеллекта могут иметь значительные предубеждения в отношении английского языка.

“`html

Исследования показывают, что искусственный интеллект в основном использует английский язык для своих когнитивных процессов.

А задумывались ли вы когда-нибудь о том, на каком языке “думают” чатботы на искусственном интеллекте (ИИ)? 🤔 Новые исследования показывают, что эти языковые модели настроены “думать” на английском, даже когда задают им вопросы на других языках. Как будто у них есть внутреннее английское пространство, обрабатывающее всё на их родном языке, независимо от языка, на котором им представлены вопросы. 🌍

Оглянемся за кулисами

Чтобы разгадать тайну, исследователи из Швейцарского федерального института технологий в Лозанне решили приоткрыть занавес и ближе рассмотреть эти модели чатботов на ИИ. Они хотели понять внутренние механизмы этих больших языковых моделей и как они обрабатывают разные языки.

“Мы открыли эти модели и посмотрели на каждый из слоёв,” пояснил исследователь Вениамин Веселовский. “Мы хотели увидеть, можем ли мы наблюдать, что внутренние слои действительно обрабатывают информацию на английском языке?” 🤓

Многоязычное меню

Исследовательская группа выбрала три открытые модели чатботов на ИИ для своего исследования. Эти модели были протестированы с использованием подсказок на четырех разных языках: французском, немецком, русском и китайском. Подсказки имели три вариации:

  1. Повторите данное слово
  2. Переведите из одного нелатинского слова в другое
  3. Заполните пропуск одним словом в предложении

Анализируя слои обработки в чатботах на ИИ, исследователи смогли проследить путь, который проходила каждая подсказка. И что они обнаружили? 🕵️‍♀️

Обход английского подпространства

Оказалось, что эти чатботы на ИИ делают обход через то, что исследователи назвали “английским подпространством.” Вместо прямого перевода с одного языка на другой, например, с французского на немецкий, чатботы на ИИ сначала переводят с французского на английский, а затем с английского на немецкий (или наоборот).

Почему это важно? По мнению Веселовского, это подтверждает, что эти языковые модели полагаются на английский язык как на мост, чтобы понимать определенные концепции. 😮

От перевода не осталось и следа

Хотя предпочтение чатботов к английскому языку может показаться незначительным, это вызывает опасения относительно однородности развития ИИ. Исследовательница Алия Бхатия из Центра демократии и технологий в Вашингтоне выразила беспокойство по поводу растущей зависимости от данных на английском языке для обучения моделей ИИ.

“Для обучения моделей доступно больше высококачественных данных на английском и нескольких языках ООН, чем на большинстве других языков,” пояснила Бхатия. “Это рискует навязыванием ограниченного мирового взгляда на другие лингвистически и культурно отличные регионы.” 🌐

Что нам готовит будущее?

По мере того, как развивается ИИ, важно задавать вопросы о языковом разнообразии и культурной инклюзивности. Полагаться на английский язык в качестве посредника для моделей ИИ может укреплять предубеждения и ограничивать доступ к выгодам ИИ для неговорящих на английском языках.

Хотя продвижения происходят в обучении моделей ИИ с мультиязычными данными, еще много работы предстоит сделать. Исследователи и разработчики должны придавать важность языковому и культурному разнообразию, чтобы гарантировать, что технологии ИИ действительно инклюзивны. 🌍


Вопросы и ответы

Q: Могут ли чатботы на ИИ научиться “думать” на других языках, кроме английского? A: Да, чатботы на ИИ могут научиться “думать” на нескольких языках, но на данный момент они часто полагаются на английский язык как на мост для понимания различных концепций на разных языках.

Q: Является ли предпочтение английского языка в моделях ИИ следствием ограниченности данных для обучения на других языках? A: Да, одной из причин, почему модели ИИ часто полагаются на английский, является изобилие высококачественных данных на английском по сравнению с другими языками. Разработчики часто обучают модели в основном на данных на английском языке.

Q: Каковы потенциальные последствия того, что модели ИИ в основном “думают” на английском? A: Полагание на английский язык в качестве посредника создает риск наложения ограниченного мировоззрения на лингвистически и культурно отличные регионы. Это может усиливать предвзятости и затруднять развитие технологий ИИ, учитывающих разнообразие культур и языков.


Ссылки

  1. Протестировано: чатбот Google Gemini
  2. Хотите стать специалистом по обработке данных?
  3. Источник изображения: Иероглиф

“““html


Что вы думаете о доминировании английского языка в мышлении ИИ-чатботов? Начнем разговор! Поделитесь своими мыслями в комментариях ниже и не забудьте нажать эту кнопку “Поделиться”, чтобы распространить информацию. 👇🗣️💻

“`