Неструктурированные данные скрытая золотая шахта

На протяжении некоторого времени, бизнесы боролись с неструктурированными данными. Теперь у них есть дополнительное стимулирующее воздействие на их преследование - улучшение и обогащение с помощью искусственного интеллекта.

Фотография пустых кабинетов с роботом, сидящим посередине

В поисках ключа для разблокировки генеративного ИИ с неструктурированными данными

В эпоху технологий неструктурированные данные заняли центральное положение. Эти потоки данных, состоящие из текстов, графики, документов и потоков IoT, обладают огромной ценностью, которая до сих пор остается неизвлеченной. По мере развития цифрового ландшафта базы данных должны были приспособиться, чтобы адаптироваться и выдавать эти ценные активы.

🔎 Поиск скрытых сокровищ

Несмотря на потенциал неструктурированных данных, компании медленно осознают его силу. Удивительно, что только 46% компаний предпринимают усилия, чтобы извлечь ценность из 90% неструктурированных данных, которые присутствуют в их предприятиях [^1^]. Это недостаток осведомленности и использования препятствует прогрессу в этой области.

Генеративный ИИ: освобождение силы

Теперь появление генеративного искусственного интеллекта (генеративного ИИ) вызвало новую необходимость в исследовании данных. Компании и ИТ-специалисты, которые оказались во главе движения по неструктурированным данным, оказались в привилегированном положении для использования генеративного ИИ, чтобы проникнуть глубже в свои хранилища данных [^2^].

Согласно Мэтту Лабовичу, руководителю отдела данных, аналитики и искусственного интеллекта PwC в США, предприятия должны сосредоточиться на управлении неструктурированными данными, полученными из различных источников, таких как IoT и документы с знаниями, например презентации PowerPoint, текстовые файлы и электронные таблицы Excel. Эти хранилища институциональных знаний и оперативной информации могут быть использованы с помощью генеративного ИИ [^3^].

От структурированных к неструктурированным

Хотя структурированные данные традиционно привлекали больше внимания, пришло время признать значительную роль неструктурированных данных в развитии генеративного ИИ. Как подчеркивает Лабович, сложность сбора, аннотирования и синтеза гетерогенных наборов данных затруднила широкое внедрение проектов искусственного интеллекта [^4^]. Однако генеративный ИИ способен раскрыть и использовать ранее скрытые данные, что приводит к значительному прогрессу в организациях [^5^].

🚩 Важность охвата и использования данных

Захват и извлечение ценности из неструктурированных данных стало важнее прежде. Поэтому около 70% руководителей в сфере технологий, которые приняли участие в последнем исследовании, признали, что проблемы, связанные с данными, являются самой большой угрозой для достижения их целей в области ИИ и машинного обучения [^6^]. Языковые модели, такие как ChatGPT, зависят от больших корпусов текстовых данных для генерации качественных результатов для различных задач, основанных на статистических вероятностях [^7^].

Адам Грин, автор опроса, опубликованного в MIT Technology Review Insights, подчеркивает важность надежной инфраструктуры данных для приложений генеративного ИИ. Объединенная платформа данных, поддерживающая аналитику и искусственный интеллект, считается ключевой для успеха генеративного ИИ. Она обеспечивает доступность к данным, безопасность и сочетание экономичного хранения с высокопроизводительным запросом [^8^].

💡 Решение головоломки данных

Объединение платформ данных для аналитики и ИИ является приоритетом для более двух третей респондентов опроса, которые признают важность интеграции стратегий данных в эру генеративного ИИ. Однако сбор неструктурированных данных – это сложная задача. Фрагментированная ИТ-архитектура, образованная в результате слияний и приобретений, привела к потере важных документов, запертых в автономных собственных форматах файлов [^9^].

🔒 Получение понимания при помощи языковых моделей

Эндрю Блайтон, вице-президент и главный информационный офицер Incyte, признает потенциал языковых моделей для извлечения ценности из неструктурированных данных. Путем использования этих моделей совместно с неструктурированными данными бизнесы могут получить ценные идеи из обширного мира документации [^10^].

👥 Сила коллаборации

Чтобы добиться успеха в области генеративного ИИ, организации должны вовлечь владельцев данных, аналитиков и пользователей из разных отделов. Успех данных не является только ответственностью главы отдела информационных технологий; он требует сотрудничества и поддержки руководителей бизнеса. Готовность к работе, управление изменениями и участие руководства являются важными факторами при идентификации ключевых данных, их интеграции в рабочие процессы и широком использовании [^11^].

🤔 Ответы на вопросы читателей:

Вопрос: Как организации могут извлечь ценность из неструктурированных данных?
О: Организации могут использовать генеративный ИИ для обнаружения скрытых идей в неструктурированных данных. Эффективное управление неструктурированными источниками данных, такими как IoT и документы с знаниями, позволяет бизнесам использовать ценные институциональные знания о своей деятельности и получать полезные идеи, используя технологию генеративного ИИ [^3^].

Вопрос: Как моделирование языка играет роль в анализе неструктурированных данных?
A: Модели языка, такие как ChatGPT, полагаются на огромное количество данных для генерации ответов или выполнения различных задач. С помощью моделей языка бизнесы могут обучать модели извлекать идеи и отвечать на вопросы из огромного объема неструктурированной документации [^7^] [^10^].

Вопрос: Насколько важна унифицированная платформа данных для генеративного ИИ?
A: Унифицированная платформа данных, объединяющая аналитические и ИИ возможности, является ключевой для успеха генеративного ИИ. Она демократизирует доступ к данным, повышает безопасность и комбинирует доступное хранилище с высокопроизводительным запросом. Эта инфраструктура позволяет бизнесам полностью использовать потенциал технологии генеративного ИИ [^8^].

Вопрос: Какую роль должны играть руководители бизнеса для успешной адаптации стратегий по работе с данными?
A: Руководители бизнеса должны взять на себя ответственность за процесс, активно участвуя в определении критически важных данных и интеграции их в рабочие процессы. Они должны стать сторонниками изменений, участвуя в широкомасштабной адаптации технологии генеративного ИИ, вовлекая исполнительные руководители по всей организации. Главный информационный офицер должен играть роль поддержки в этом процессе [^11^].

📚 Дополнительное чтение:

  1. Инструменты генеративного ИИ для повышения продуктивности предприятий
  2. Роль ИИ как разработчика и помощника при тестировании
  3. Обещание и опасность ИИ на работе в 2024 году – отчет о технологических тенденциях Deloitte

Не забудьте поделиться этой статьей с друзьями и коллегами, чтобы продолжить беседу! 💬✨