Алгоритмы искусственного интеллекта предвзяты против кожи с желтоватым оттенком

Алгоритмы ИИ против желтой кожи

После того, как в 2018 году появились доказательства того, что ведущие алгоритмы анализа лиц менее точны для людей с темной кожей, компании, включая Google и Meta, приняли меры по тестированию эффективности своего программного обеспечения ИИ с учетом оттенков кожи. Новые исследования от Sony показывают, что эти тесты игнорируют важный аспект разнообразия цвета человеческой кожи.

Согласно исследованиям сотрудников Sony, существующие методы, основанные на шкале от самого светлого до самого темного или от белого до черного, игнорируют вклад желтых и красных оттенков в спектр человеческой кожи. Они обнаружили, что генеративные системы ИИ, алгоритмы обрезки изображений и инструменты анализа фотографий имеют сложности особенно с желтоватой кожей. Та же слабость может быть отмечена и у других технологий, точность которых доказана зависимостью от цвета кожи, таких как программное обеспечение ИИ для распознавания лиц, отслеживания тела и обнаружения deepfake, а также устройств, таких как мониторы сердечного ритма и датчики движения.

“Если продукты оцениваются только в этой очень одномерной форме, то множество предубеждений останется незамеченными и неразрешенными”, – говорит Элис Ксианг, ведущий исследователь и глава глобального отдела по этике ИИ в Sony. “Наша надежда заключается в том, что наша работа поможет заменить некоторые из существующих шкал оттенков кожи, которые фактически фокусируются только на светлом и темном.”

Однако не все уверены в том, что существующие варианты недостаточны для оценки систем ИИ. Эллис Монк, социолог из Гарвардского университета, говорит, что палитра из 10 оттенков кожи, предлагающая варианты от светлого до темного, которую он представил вместе с Google в прошлом году, не является одномерной. “Я должен признать, что меня немного смущает утверждение о том, что предыдущие исследования в этой области игнорировали оттенки и оттенки”, – говорит Монк, шкала оттенков кожи Монка Google предоставляет для использования другими. “Исследования были посвящены определению, какие оттенки следует приоритетно использовать на шкале и в каких точках”. Он выбрал 10 оттенков кожи на своей шкале на основе своих собственных исследований колоризма и после консультаций с другими экспертами и представителями недостаточно представленных сообществ.

Кс. Эйе, глава консультационного центра по этике ИИ Malo Santo и ранее основатель исследовательской команды по оттенкам кожи Google, говорит, что шкала Монка никогда не была задумана как окончательное решение, и называет работу Sony важным прогрессом. Однако Эйе также предупреждает, что положение камеры влияет на цветовые значения CIELAB на изображении, что является одной из нескольких проблем, делающих этот стандарт потенциально ненадежной точкой отсчета. “Прежде чем мы включим измерение оттенка кожи в алгоритмы ИИ реального мира, такие как фильтры для камер и видеоконференции, требуется дополнительная работа для обеспечения однородного измерения”, – говорит Эйе.

Споры о шкалах имеют большое значение. Нахождение соответствующих мер “справедливости”, как это называют исследователи ИИ, является одним из главных приоритетов для технологической индустрии, поскольку законодатели, включая Европейский союз и США, обсуждают вопрос о требовании компаниям проверять свои системы ИИ и указывать на риски и недостатки. Несправедливые методы оценки могут подорвать некоторые практические преимущества регулирования, говорят исследователи Sony.

По вопросу цвета кожи Ксианг говорит, что усилия по разработке дополнительных и улучшенных мер будут бесконечными. “Нам нужно продолжать стремиться к прогрессу”, – говорит она. Монк говорит, что разные меры могут оказаться полезными в зависимости от ситуации. “Я очень рад, что в этой области проявляется все больший интерес после долгого периода забвения”, – говорит он. Представитель Google Брайан Габриэль говорит, что компания приветствует новые исследования и изучает их.

Если продукты оцениваются только в этой очень одномерной форме, предубеждения останутся незамеченными и неразрешенными

Цвет кожи человека образуется в результате взаимодействия света с белками, кровяными клетками и пигментами, такими как меланин. Стандартным способом проверки алгоритмов на предубежденность, связанную с цветом кожи, было проверка их работы на разных оттенках кожи, в соответствии с шкалой Фицпатрика, состоящей из шести вариантов от самого светлого до самого темного. Она была разработана дерматологом для оценки реакции кожи на УФ-излучение. В прошлом году исследователи ИИ в технологической сфере приветствовали появление шкалы Монка от Google, называя ее более инклюзивной.

Исследователи Sony говорят в своем исследовании, которое будет представлено на Международной конференции по компьютерному зрению в Париже на этой неделе, что международный цветовой стандарт CIELAB, используемый в фото-редактировании и производстве, указывает на еще более точный способ представления широкого спектра цвета кожи. Когда они применили стандарт CIELAB для анализа фотографий разных людей, они обнаружили, что цвет их кожи различается не только по тональности – глубине цвета, но и по оттенку, или его градации.

Шкалы оттенков кожи, которые не улавливают красные и желтые оттенки человеческой кожи, кажется, помогли сохранить некоторые предубеждения в алгоритмах обработки изображений. Когда исследователи Sony проверили открытые системы искусственного интеллекта, включая алгоритм обрезки изображений, разработанный Twitter, и пару алгоритмов генерации изображений, они обнаружили предпочтение к более красной коже, что означает, что значительное число людей с более желтоватым оттенком кожи представлено в конечных изображениях, созданных алгоритмами, в меньшей степени. Это может привести к невыгоде для различных народов, включая народы Восточной Азии, Южной Азии, Латинской Америки и Ближнего Востока.

Исследователи Sony предложили новый способ представления цвета кожи для учета ранее игнорируемого разнообразия. Их система описывает цвет кожи на изображении с помощью двух координат вместо одного числа. Она указывает на место на шкале от светлого к темному и на континууме от желтого к красному или тональности от теплого к холодному, которые иногда называются теплыми и холодными оттенками в косметической индустрии.

Новый метод работает путем выделения всех пикселей на изображении, которые показывают кожу, преобразования значений цвета RGB каждого пикселя в коды CIELAB и вычисления среднего оттенка и тона внутри кластеров пикселей кожи. В статье приводится пример видимых портретных фотографий бывшей звезды американского футбола Террелла Оуэнса и покойной актрисы Евы Габор, имеющих одинаковый тон кожи, но разделенные оттенком, где портрет Оуэнса более красный, а Габор – более желтый.

Цветовые шкалы, которые неправильно улавливают красные и желтые оттенки человеческой кожи, способствуют сохранению незамеченных искажений в алгоритмах обработки изображений.

Когда команда Sony применила свой подход к данным и системам искусственного интеллекта, доступным онлайн, они обнаружили значительные проблемы. Исследователи обнаружили, что популярный набор данных изображений знаменитостей CelebAMask-HQ, используемый для обучения программ распознавания лиц и других систем компьютерного зрения, имел 82 процента изображений с красными оттенками кожи, а другой набор данных FFHQ, разработанный Nvidia, на 66 процентов был смещен в сторону красного, а две генеративные модели искусственного интеллекта, обученные на наборе данных FFHQ, воспроизвели данные искажения: около четырех из пяти сгенерированных ими изображений были смещены в сторону красного оттенка.

Но это не все. При идентификации, соответствуют ли два портрета одному и тому же человеку, программы искусственного интеллекта ArcFace, FaceNet и Dlib давали более точные результаты на более красной коже, согласно исследованию Sony. Дэвис Кинг, разработчик библиотеки Dlib, говорит, что не удивлен этим смещением, так как модель обучена в основном на фотографиях знаменитостей США. Облачные инструменты искусственного интеллекта от Microsoft Azure и Amazon Web Services, используемые для обнаружения улыбок, также работали лучше на красных оттенках. Nvidia отказалась комментировать, а Microsoft и Amazon не ответили на запросы для комментария.

Как человек с желтоватой кожей, обнаружение ограничений существующего подхода к тестированию искусственного интеллекта волнует Сян. Она говорит, что Sony будет анализировать свои собственные модели компьютерного зрения, сосредоточенные на человеке, с использованием новой системы при их пересмотре, хотя она отказалась указать, о каких именно моделях идет речь. “У всех нас такие разные оттенки кожи. Это не должно использоваться для дискриминации против нас”, – говорит она.

Подход Sony имеет дополнительное потенциальное преимущество. Методы, такие как Monk scale от Google, требуют, чтобы люди категоризировали, куда в спектре оттенков попадает та или иная кожа. Это задача, которая, по словам разработчиков искусственного интеллекта, вносит неопределенность, потому что восприятие людей зависит от их местоположения или представлений о расе и идентичности.

Подход Sony полностью автоматизирован – не требуется суждение человека. Однако Монк из Гарварда сомневается, что это лучший вариант. Объективные методы, подобные методам Sony, могут упрощать или игнорировать другие сложности человеческого разнообразия. “Если нашей целью является искоренение предвзятости, которая также является социальным явлением, то я не уверен, что мы должны исключать из анализа то, как люди социально воспринимают оттенок кожи”, – говорит он.

Джоанн Рондилла, социолог из Сан-Хосе, изучающая проблемы цветизма и азиатско-американских сообществ, говорит, что она ценит попытку Sony учитывать оттенки. Она также надеется, что разработчики искусственного интеллекта будут сотрудничать с социальными учеными, чтобы рассмотреть, как политика, структуры власти и дополнительные аспекты общества влияют на восприятие цвета кожи. Шкала, “разработанная в рамках проекта Sony, может помочь ученым понять проблемы цветизма”, – говорит она.

Сян из Sony признает, что цветизм неизбежно присутствует в том, как люди обсуждают и думают о коже. В конечном счете, не только машинам нужно смотреть на цвета по-другому. Она надеется, что отрасль сможет сделать лучше, но также понимает, что прогресс не обязательно будет гладким. Хотя исследователи в области искусственного интеллекта, такие как она сама, продвигали более сложное представление о гендере, многие исследования продолжают классифицировать каждого человека по бинарной системе – мужчина или женщина.

“Эти крайне проблематичные процессы происходят из сильного желания поместить людей в наименьшие возможные группы, чтобы получить оценку справедливости и пройти некую проверку”, – говорит Сян. Упрощение имеет свою ценность, говорит она, но важно добавлять новые измерения, когда действия по сделать людей “читаемыми” для машин приводят к затруднению в учете их истинного разнообразия.