7 способов убедиться, что ваши данные готовы для генеративного искусственного интеллекта

7 способов гарантировать подготовленность ваших данных для генеративного искусственного интеллекта

Блоки данных ИИ, сложенные вместе

Каждый хочет воспользоваться мощью генеративного искусственного интеллекта (ИИ) и больших языковых моделей, но есть одна загвоздка. Чтобы ИИ соответствовал своим “небесным” ожиданиям, необходимы качественные данные, а в этом плане многие организации не справляются.

Последнее исследование McKinsey, проведенное авторами Джо Касерта и Кайваном Рошанкишем, подчеркивает настойчивое желание “сделать что-то с генеративным ИИ”. Однако это желание сопровождается и другими проблемами: “Если ваши данные не готовы для генеративного ИИ, ваш бизнес не готов для генеративного ИИ.”

Кроме того: Если ИИ – это будущее вашего бизнеса, должен ли главный информационный офицер им управлять?

Авторы исследования советуют ИТ-менеджерам и менеджерам данных “чертовски хорошо разобраться в вопросах данных, связанных с генеративным ИИ”. Данные могут быть использованы через существующие службы с помощью API или собственных моделей бизнеса, что потребует “совершенствования стратегии маркировки и классификации данных, а также более значительных вложений”.

По мнению Касерты и его команды, наиболее сложно “работать с генеративным ИИ с неструктурированными данными, такими как чаты, видео и код”. “Традиционно у организаций по обработке данных были возможности только для работы с структурированными данными, такими как данные в таблицах”.

Кроме того: Бизнесу требуется новая модель управления для конкуренции в экономике, основанной на ИИ

Это изменение в вопросах данных означает, что организации должны пересмотреть общую архитектуру данных, поддерживающую инициативы генеративного ИИ. “Хотя это может показаться старыми новостями, проблемы, с которыми бизнес раньше мог справиться, с генеративным ИИ станут серьезными. Многие преимущества генеративного ИИ просто недоступны без прочной основы данных”, предупреждают авторы.

В отрасли все больше лидеров выражают беспокойство о способности предприятий справляться с огромным наплывом данных, необходимых для управления новыми задачами, такими как генеративный ИИ. “Цифровые трансформации, основанные на неудержимых инновациях и технологических достижениях, означают изменение способа работы организаций”, говорит Джефф Хеллер, вице-президент технологий и операций в Faction, Inc.

Кроме того: 4 способа, как генеративный ИИ может стимулировать экономику

“В этой стремительно меняющейся среде практически каждый отдел, начиная от исследований и разработок до ежедневной операционной деятельности, ведет себя иначе благодаря разрастанию количества устройств и передовых технологий”.

Кроме того, ИИ не является единственным фактором, определяющим необходимость в более эффективных и отзывчивых архитектурах данных. “Клиенты по-прежнему ожидают индивидуального обслуживания и коммуникаций, которые, конечно же, сильно зависят от точных данных”, говорит Боб Брауэр, основатель и генеральный директор компании Interzoid.

Кроме того: 5 способов продать свою революционную идею всему бизнесу

“Нарастающая зависимость от аналитических и визуализационных инструментов, важных для стратегических решений, потребует серьезной зависимости от данных. И по мере того, как искусственный интеллект становится более явным, данные становятся неотъемлемой основой для обучения этих моделей ИИ”.

Сообщение, по мнению Хеллера, ясно — настало время для бизнеса разработать стратегии и принять передовые технологии, чтобы “гарантировать, что данные остаются ценным активом, а не подавляющим обязательством.”

Эксперты предлагают рассмотреть следующие элементы, чтобы подготовить данные к быстроразвивающейся эпохе ИИ:

  1. Установите стратегию управления данными: “С правильными приоритетами, персоналом, управлением, инструментами и указанием руководства, предприятия могут превратить свои проблемы с качеством данных из обязательства в значительное конкурентное преимущество”, – говорит Брауэр. Шагом к получению организационной поддержки для данных, лежащих в основе ИИ и других инициатив, может стать создание “силовой группы или подходящего эквивалента для организаций разных размеров, чтобы исследовать, как новые инновации генеративного ИИ, моделирования больших языков и другие новые технологии на основе ИИ могут быть применены для получения конкурентного преимущества.”
  2. Установите стратегию хранения данных: Найти место, чтобы разместить все эти данные, и обеспечить их доступность и обнаружимость, является важной частью головоломки. Последние отраслевые опросы показывают, что “более половины всех хранимых данных – 60% – неактивны, что означает, что к ним редко или никогда не обращаются”, – говорит Брайан Павловски, главный директор по развитию в компании Quantum. “Тем не менее, бизнесы не хотят от них отказываться, так как понимают, что данные могут предложить ценные решения и бизнес-ценность в будущих годах, особенно в свете всеобщего использования генеративного ИИ.” Эта дилемма требует переоценки существующих возможностей для “установления современных автоматизированных архитектур хранения, позволяющих легко получать доступ к активным и неактивным данным на всех этапах их жизненного цикла”, – добавляет Павловски.
  3. Убедитесь, что у вас есть стратегия качества данных: Подготовка архитектуры данных к новым требованиям, основанным на ИИ, должна начинаться с приоритетного установления высокого уровня качества данных, – советует Брауэр. “Хороший старт это назначение главного исполнительного директора данных или эквивалентной роли, с бюджетом и ресурсами, специально предназначенными для инициатив в области качества данных.”
  4. Убедитесь, что вы измеряете прогресс: “Приоритетами руководства должны быть оценки данных в пределах всей организации и установление метрик и целей для измерения успеха”, – говорит Брауэр.
  5. Убедитесь, что вы умеете работать с неструктурированными данными: Проблемы с качеством данных становятся более острой при использовании генеративных моделей ИИ, чем классических моделей машинного обучения, “потому что имеется гораздо больше данных, и большая часть из них неструктурированы, что затрудняет использование существующих инструментов для их отслеживания”, – указывают Касерта и команда McKinsey. “Неструктурированные данные составляют около 90% данных, создаваемых в будущем, и мировая ёмкость постоянно растёт на 25% годового темпа роста в ближайшие пять лет”, – говорит Павловски. “Эти неструктурированные данные – это то, что хранится в файлах и объектах: видео и изображения с высоким разрешением, сложные медицинские данные, декодирование генома, входные данные для моделей машинного обучения, собранные научные данные о природном мире, такие как картографирование нефтегазовых месторождений, и симуляции реальности, включая спецэффекты, анимацию и дополненную реальность. Критически важно, чтобы организации внедряли решения, которые управляют жизненным циклом данных автоматически и используют передовые технологии, такие как ИИ, для извлечения дополнительной бизнес-ценности”.
  6. Внедрите возможности в архитектуру данных для поддержки широкого спектра применений: “Внедрите соответствующие возможности (например, векторные базы данных и конвейеры предварительной и постобработки данных) в существующую архитектуру данных, особенно в поддержку неструктурированных данных”, – указывают Касерта и соавторы.
  7. Используйте ИИ для создания ИИ: “Используйте генеративный ИИ, чтобы помочь управлять вашими собственными данными”, – предлагает команда McKinsey. “Генеративный ИИ может ускорить существующие задачи и улучшить способ их выполнения по всей цепочке создания ценности данных, начиная от инженерии данных и заканчивая управлением и анализом данных.”

ИИ обещает совершать удивительные вещи, но для этого требуется хорошо управляемые данные, чтобы достичь правильного результата.