Генеративное искусственное интеллект (AI) заставляет компании еще больше жаждать вашей информации

Генеративное искусственное интеллект (AI) увеличивает желание компаний получить вашу информацию

Zoom, компания, которая сделала нормальным посещение деловых встреч в пижамных штанах, на этой неделе была вынуждена отключиться от микрофона, чтобы заверить пользователей, что она не будет использовать личные данные для обучения искусственного интеллекта без их согласия.

Внимательный пользователь Hacker News на прошлой неделе заметил, что обновление условий использования Zoom в марте, по всей видимости, давало компании свободу собирать голосовые, видео и другие данные и передавать их в системы машинного обучения.

В новых условиях было указано, что клиенты “соглашаются на доступ, использование, сбор, создание, изменение, распространение, обработку, передачу, поддержку и хранение данных, сгенерированных сервисом Zoom” в целях “машинного обучения или искусственного интеллекта (включая обучение и настройку алгоритмов и моделей).”

Это обнаружение привело к критическим новостным статьям и гневным публикациям в социальных сетях. Вскоре Zoom отступил. В понедельник главный продуктовый директор Zoom Смита Хашам написала в блоге: “Мы не будем использовать аудио-, видео- или чат-контент клиентов для обучения наших моделей искусственного интеллекта без вашего согласия”. Компания также обновила свои условия, чтобы сказать то же самое.

Эти обновления кажутся достаточно обнадеживающими, но, конечно, многие пользователи Zoom или администраторы корпоративных учетных записей могут нажать “ОК” на условиях, не полностью осознавая, что они передают. И сотрудники, которым требуется использовать Zoom, могут не знать о выборе, сделанном их работодателем. Один юрист отмечает, что условия все еще позволяют Zoom собирать большое количество данных без согласия. (Zoom не ответил на запрос о комментарии.)

Этот скандал показывает отсутствие значимой защиты данных в период бума генеративного искусственного интеллекта, когда технологическая индустрия стала еще более голодной к данным, чем раньше. Компании начали рассматривать генеративный искусственный интеллект как своего рода монстра, которого следует кормить любой ценой, даже если не всегда ясно, для чего именно нужны эти данные и чем могут заниматься будущие системы искусственного интеллекта.

Возникновение генераторов изображений на основе ИИ, таких как DALL-E 2 и Midjourny, а затем ChatGPT и других умных, но неполноценных чат-ботов, было возможным благодаря огромным объемам тренировочных данных, в том числе защищенных авторским правом, собранных из сети. Все больше компаний сейчас стремятся использовать данные, которыми они владеют или которые генерируются их клиентами и пользователями, для создания инструментов генеративного искусственного интеллекта.

Zoom уже присоединился к волне генеративного искусственного интеллекта. В июне компания представила две функции генерации текста для краткого изложения встреч и написания электронных писем о них. Zoom, возможно, может использовать данные с видеовстреч пользователей для разработки более сложных алгоритмов. Они могут кратко описывать или анализировать поведение отдельных лиц на встречах или даже создавать виртуальное подобие для кого-то, у кого временно пропало соединение или кто не успел принять душ.

Проблема с попыткой Zoom получить больше данных заключается в том, что это отражает общую ситуацию в отношении наших личных данных. Многие технологические компании уже получают прибыль от нашей информации, и многие из них, как Zoom, ищут способы получить больше данных для проектов генеративного искусственного интеллекта. И все же нам, пользователям, приходится пытаться контролировать то, что они делают.

“Компании имеют крайнюю желание собирать как можно больше данных”, – говорит Джанет Хейвен, исполнительный директор исследовательского центра Data and Society. “Это бизнес-модель – собирать данные и создавать на их основе продукты или продавать данные брокерам данных”.

В США отсутствует федеральный закон о конфиденциальности, что делает потребителей более уязвимыми для голода данных, вдохновленного ChatGPT, по сравнению с жителями ЕС. Предлагаемые законодательные акты, такие как American Data Privacy and Protection Act, предлагают некоторую надежду на создание более строгих федеральных правил в отношении сбора и использования данных, и AI Bill of Rights администрации Байдена также требует защиты данных по умолчанию. Но пока что общественное возмущение, подобное тому, что возникло в ответ на действия Zoom, является наиболее эффективным способом ограничить аппетиты компаний на данные. К сожалению, это надежный механизм для выявления каждого сомнительного решения компаний, стремящихся конкурировать в области искусственного интеллекта.

В эпоху, когда самые захватывающие и широко прославленные новые технологии разрабатываются на основе огромных объемов данных, собранных у потребителей, часто сомнительными этически способами, кажется, что новая защита не может прийти слишком скоро. “Каждый человек должен предпринять шаги для защиты себя”, – говорит Хейвен. “Это противоречит идее, что это проблема общества”.