Улучшение систем мониторинга водителя аргументация синтетических данных

Улучшение системы мониторинга водителя с помощью синтетических данных

Системы мониторинга водителя (DMS), которые оценивают бодрствование за рулем, быстро становятся ведущей автомобильной функцией безопасности по всему миру. В ЕС, например, регулятор безопасности автотранспорта EuroNCAP требует, чтобы все новые автомобили включали в себя DMS, чтобы соответствовать его рейтингу безопасности.

В условиях такой поддержки, стартапы получают бизнес-возможности в области DMS, предлагая решения, включающие в себя измерение сердечных показателей и обнаружение начала сна. Среди них Devant из Швеции использует потенциал синтетических данных.

Запущенный в 2021 году, стартап генерирует синтетические данные о реалистичных цифровых людях для поддержки обучения, проверки и тестирования сетей машинного обучения, таких как те, которые используются в системах мониторинга водителя. Конкретно, он разрабатывает 3D симулированных людей, разнообразных как по внешнему виду, так и по поведению в различных ситуациях.

Но как именно синтетические данные могут улучшить DMS? Мы поговорили об этом с Ричардом Бремером, сооснователем и генеральным директором Devant.

Пробелы, которые синтетические данные могут заполнить

Интерес к синтетическим данным возник в начале 1990-х годов, и технологическая отрасль быстро поняла ценность этой технологии для ускорения машинного обучения.

Автомобильная отрасль стала одним из первых сторонников использования синтетических данных, применяя их в середине 2010-х годов для разработки автономных автомобилей, систем помощи водителю (ADAS) и недавно DMS.

Мнение водителей о отвлеченном вождении в ЕС, 2019 г. Источник: ESRA Survey/Pires et al.

Системы мониторинга водителя и пассажиров (DMS и OMS) обычно используют инфракрасные камеры и датчики для сбора информации в реальном времени о водителе и пассажирах. Благодаря компьютерному зрению и машинному обучению эта информация затем анализируется, отслеживая, например, взгляд водителя или его выражение лица, чтобы определить его бодрствование и внимание к дороге.

Это означает, что для достижения наилучших результатов и DMS, и OMS должны быть обучены на большом количестве качественных данных, включающих изображения и записи, которые охватывают как можно больше разнообразных ситуаций. Например, водители, отправляющие сообщения на телефоне, пьяные за рулем или даже наклоняющиеся к заднему сиденью, чтобы остановить детей, ссорящихся.

“Для любой сети искусственного интеллекта необходимо достаточное количество данных высокого качества.”

В то время как данные с камер и актерских репетиций питали развитие DMS до сих пор, использование только этих источников для записи всех возможных ситуаций имеет несколько проблем. Это дорого, затратно по времени, ограничено в вариативности и связано с проблемами конфиденциальности.

Вот где заключается ценность синтетических данных, по словам Бремера. “Потенциал и интересная часть синтетических данных заключается в том, что вы можете сократить время и затраты, а также увеличить производительность сети”.

Как работает технология Devant

Шведский стартап из Норрчепинга использует последовательный процесс на своей платформе, объединяя различные типы 3D-ресурсов для создания изображений и анимаций. В автомобильном случае это могут быть 3D-салоны и люди, дополненные деталями, такими как аксессуары, одежда или очки.

Анимация Devant с наклоном водителя назад. Источник: Devant

Чтобы обеспечить высококачественный результат, не влияющий на производительность сети машинного обучения, надежность и точность данных проверяются с помощью серии систем оценки качества на протяжении всего процесса.

“Когда речь идет о том, что мы создали, в первую очередь это связано с тестированием и проверкой данных”, – говорит Бремер.

Цель Devant для своих 3D-моделей людей заключается в том, чтобы соответствовать реальному миру, расширить их разнообразие и предложить самый широкий спектр различных сценариев, а также удовлетворить требования клиентов.

По этой причине шведский стартап предлагает инструмент конфигурации для выбора параметров, соответствующих потребностям пользователей. Настройки могут варьироваться от более общих переменных (например, возраст, этническая принадлежность и пол) до более конкретных деталей, включая одежду, частоту движения век и условия освещения внутри автомобиля.

Анимация отвлечения от телефона. Источник: Devant

В июне компания объединилась с австралийской компанией Seeing Machines, разработчиком (DMS и OMS), которые используются крупными автомобильными производителями.

В рамках партнерства Seeing Machines будет использовать 3D-симуляции Devant для обучения и проверки своих сетей машинного обучения с целью дальнейшего совершенствования систем мониторинга в салоне автомобиля и создания крупномасштабного набора данных о поведении отвлеченного водителя, соответствующего требованиям EuroNCAP.

Качество так же важно, как количество

Чтобы полностью раскрыть потенциал синтетических данных, необходимо не только нажать кнопку и сгенерировать миллионы изображений за несколько дней, объясняет Бремер. Важным является также качество и точность данных.

Предпосылка проста. “Для того чтобы нейронная сеть ИИ работала максимально эффективно, необходимо достаточное количество и достаточное качество”, – говорит он.

Приятной особенностью компьютерно-сгенерированных данных является то, что “благодаря сопроводительным метаданным мы точно знаем, что содержит каждое изображение на уровне пикселя”, – говорит Бремер. В отличие от реальных данных, “у вас нет такого уровня детализации и точности управления, как у синтетических данных”.

Анимация водителя, откинувшегося назад. Автор: Devant

Но есть подвох. Чем выше качество данных за счет добавления большего количества параметров и реализма, чтобы охватить огромное количество возможных сценариев и поведения людей, тем сложнее это становится. Это, в свою очередь, увеличивает время визуализации.

“Вот почему никто до нас не применял такой подход качества к синтетическим данным, потому что это так дорого с точки зрения времени визуализации”, – утверждает Бремер. Фактически, Devant довольно долго боролась с задачей сохранения качества при оптимизации скорости.

Текущие ограничения

Несмотря на очевидное преимущество синтетических данных в количестве и их способности предоставлять точные, высококачественные симуляции, Бремер подчеркивает, что технологию не следует рассматривать как “серебряную пулю”. По крайней мере, пока нет.

Вместо этого, говорит он, замена реальных данных их компьютерно-сгенерированным эквивалентом должна осуществляться шаг за шагом, с осторожным подходом.

“Я думаю, что самое важное здесь – это то, что системы DMS критически важны для жизни”, – отмечает он. И есть еще ряд проблем, которые нужно преодолеть – это не только необходимость иметь тысячи 3D-моделей для обеспечения достаточного охвата.

Ричард Бремер, сооснователь и генеральный директор Devant. Автор: Devant

Первая проблема заключается в установлении порога для определения, что является хорошими и плохими данными, над чем Devant будет работать в сотрудничестве с Seeing Machines. Вторая проблема заключается в определении, какие данные сеть машинного обучения будет признавать достаточно важными для использования.

Стартап также прикладывает дополнительные усилия для охвата большего количества аспектов оптики камеры. “Симуляция различных параметров камеры очень сложна, особенно когда вам нужно сделать это в ограниченное время визуализации на каждое изображение”, – объясняет Бремер.

Путь вперед

На данный момент Devant работает над разными уровнями отвлечения водителя, особое внимание уделяя реалистичной симуляции глаза, с его различными движениями, поведением век и различными размерами зрачков.

Благодаря партнерству с Seeing Machines стартап стремится продвигаться по пути сложности и продолжать добавлять возможности, которые охватывают весь протокол EuroNCAP. Кроме того, Бремер видит сонливость как “следующее естественное явление”, а интоксикацию – еще одну интересную возможность в списке компании.

Решение Devant разрабатывать человеко-ориентированные синтетические данные для автомобильной промышленности было целенаправленным с самого начала, обусловленным бизнес-возможностью, представленной увеличивающимся вниманием к DMS и предстоящим регулированием ЕС. По словам Бремера, это также о создании реальной ценности и использовании технологии в пользу людей.

Помимо автомобильной отрасли, стартап видит другие потенциальные отрасли, где его технологии могут оказать положительное влияние, например, обучение систем ИИ обнаруживать признаки заболеваний на ранних стадиях.