Что это такое? Система распознавания лиц – это комплекс оборудования и ПО, который может идентифицировать человека. Точность работы такой системы варьируется от 99,9 до 99,9995 %, что практически исключает возникновение ошибок.
Кому нужна? Если раньше данная технология применялась только в масштабах государства, то теперь и бизнес может ее использовать для различных задач в сфере безопасности. Но для начала следует разобраться в устройстве системы и принципах ее работы.
- Устройство системы распознавания лиц
- Детектор лиц
- Выравниватель
- Эмбеддер — распознаватель, извлекает эмбединг и дескрипторы
- Трекер
- Этапы работы системы распознавания лиц
- Обнаружение
- Нормализация
- Создание «отпечатка лица»
- Сферы применения системы распознавания лиц
- Разблокировка смартфонов
- Обеспечение правопорядка
- Аэропорты и пограничный контроль
- Поиск пропавших без вести
- Снижение хищений при осуществлении торговли
- Повышение качества обслуживания в розничной торговле
- Банки и кредитные учреждения
- Маркетинг и реклама
- Здравоохранение
- Контроль посещаемости студентами и персоналом
- Распознавание водителей
- Принципы работы системы распознавания лиц
- Требования к системам распознавания лиц в СКУД
- Время прохождения через турникет
- Процент корректной идентификации лица
- Распознавание по нескольким признакам
- Расширение базы данных
- Размещение камер для системы распознавания лиц
- Программы распознавания лиц
- Face Director
- VOCORD Face Control
- Советы по установке системы распознавания лиц
Устройство системы распознавания лиц
Система распознавания лиц работает на основе обученного пайплайна – совокупности взаимосвязанных программ. В него включаются следующие элементы:
Детектор лиц
Обучается независимо от остальных составляющих. Требует наличия датасета с базой размеченных изображений лиц – bounding boxes. В идеале в них должны быть размечены не только прямоугольники, но и ключевые точки – нос, глаза губы и т. д. При отсутствии собственного датасета подойдет публичная база, например WIDER face, включающая свыше 300 000 изображений.
Чаще всего используется готовая архитектура детектора, например MTCNN, Retina Face, SCRFD, Yolov 5 Face. Каждый из них можно дополнительно обучить и увеличить быстродействие.
Выравниватель
Данный элемент обычно не требует обучения. Он отвечает за установку правильного положения лица в кадре. Сначала детектор определяет прямоугольник и расположение ключевых точек (их обычно пять), после чего при помощи аффинного преобразователя эти точки сдвигаются вместе с остальными частями лица до идеального положения.
Эмбеддер — распознаватель, извлекает эмбединг и дескрипторы
Наиболее важный элемент системы, имеющий самый большой объем. Для него необходимы три составляющие:
- Качественная архитектура нейросети. Ее чаще всего берут на Imagenet — крупнейшем бенчмарке в компьютерном зрении, или набор из нескольких архитектур в совокупности с дистилляцией знаний (knowledge distillation).
- Объемный датасет. Включает несколько сотен тысяч разных изображений людей всех рас, полов, возрастов. Датасет может быть открытым. Раньше наиболее популярны были MSCeleb1M, VGG2, UMD faces, MegaFace. Датасет можно составить и самостоятельно либо приобрести его у сторонних компаний.
- Хорошая функция потерь (loss function). В качестве таковой чаще всего используют ArcFace или ее модификации. Обучение модели выполняется как задача классификации.
От обученной модели отнимают последний полный связанный слой, в результате остается эмбеддер.
Трекер
Используется для мониторинга траектории человека и применяется не во всех системах. Так, мобильное приложение вашего банка вполне способно обойтись и без этого элемента, но в уличных системах распознавания он должен присутствовать обязательно, так как позволяет избежать повторного запуска детектора лица по каждому кадру. В магазинах трекер часто применяется для определения наиболее востребованных площадей с товарами. Чаще всего в основе трекера находится фильтр Калмана и венгерский алгоритм.
При анализе данных с видеокамеры эмбединг формируется с каждого кадра, а затем из полученного набора собирается усредненное изображение. При этом фото могут быть разного качества. Чтобы низкокачественные кадры меньше влияли на итоговый результат, используется нейросеть, способная присваивать каждому изображению определенный вес.
Этапы работы системы распознавания лиц
Система распознавания лиц работает в несколько этапов. Прежде всего выполняется считывание, в ходе которого получается кадр с изображением лица, поступающий затем в центр обработки данных.
Обнаружение
В объектив камеры видеонаблюдения попадает не только сам человек, но и окружающие предметы: автомобили, деревья, забор и т. д. Для пользователя не составит труда различить все эти предметы. Для электроники же любое изображение – всего лишь небо пикселей. Для его обработки в 2001 году разработан метод Виолы – Джонса.
В основе метода находится применение особых паттернов (масок), с помощью которых различают светлые и темные участки на изображении. Программное вычисление по специальной формуле позволяет определить, какие из масок соответствуют обрабатываемому участку изображения. Любое лицо содержит ряд определенных точек: глаза, нос и т. д. Если все обязательные паттерны обнаружены в некоторой зоне изображения, то программа расценивает эту зону как человеческое лицо. Для эффективного использования алгоритма необоримо сначала обучить его на других лицах.
В последние годы традиционный метод заменяется нейросетями. Они более устойчивы к изменениям освещенности и ракурса съемки, а также более быстры при использовании производительного вычислительного оборудования.
Нормализация
Для последующего анализа изображение подвергается обработке, в результате которого должно получиться идеальное лицо, то есть такое, которое повернуто строго прямо, достаточно четкое и имеющее размер, аналогичный кадрам в датасете. Эта задача решается при помощи различных преобразований: поворот, уменьшение или увеличение, растягивание и т. п.
Создание «отпечатка лица»
Особенности данной операции определяются используемыми для ее выполнения алгоритмами. Все множество таковых можно разделись на две большие группы: машинные и геометрические.
При геометрическом методе исследуется совокупность признаков лица, создается массив данных, который сопоставляется с эталоном, и при выявлении совпадения лицо считается обнаруженным.
Сравнение обычно производится по ключевым точкам, между ними измеряется расстояние. В разных алгоритмах число этих точек варьируется от 68 до 2 000.
К геометрическим алгоритмам относятся метод гибкого сравнения на графах, скрытые Марковские модели, метод главных компонент и др.
Машинные методы представлены нейросетями. Для их обучения используются колоссальные базы фото, по которым анализируются отдельные признаки изображений, и в результате выявляется совпадение. Принципы работы нейросети – сложная тема. В двух словах, для всякого изображения строится вектор. В частности, для трех кадров с изображением Горбачева и двух кадров с Брежневым будет сформировано три вектора. Отличия между фото Брежнева будут незначительными, и это позволяет заключить, что на изображении находится один и тот же человек.
Крупнейшие компании, работающие в данной сфере, создают собственные алгоритмы. Так, недавно было поведено тестирование NIST, в котором оценивались продукты от многих флагманов индустрии. Лучшим был признан алгоритм от китайской Megvii, ей немного уступила российская Vision Labs, третье место досталось OT-Morpho из Франции.
Кроме перечисленных технологий, также заслуживают внимания проект Deep Face, финансируемый М. Цукербергом, FaceNet от Google, Amazon Rekognition.
Наряду с двухмерным распознаванием, для которого высоким показателем считается погрешность не более 0,1 %, используется также и технология трехмерной идентификации, обеспечивающая коэффициент ошибок не более 0,0005 %. В подобных системах применяется лазерный сканер, способный оценивать дальность до объекта, сканер со структурированной подсветкой поверхности. Наиболее продвинутая технология – FaceID, которую разработала Apple. Мобильные устройства под управлением Android также имеют собственную систему распознавания лица человека на базе 3D-карты.
Сферы применения системы распознавания лиц
Разблокировка смартфонов
Наиболее совершенные модели мобильных устройств имеют встроенную биометрическую систему распознавания лиц. В Apple утверждают, что при потере телефона риск взлома устройства человеком с похожей внешностью можно оценить не выше чем один к миллиону. Специальные технологии используются для того, что предотвратить разблокировку телефона при помощи статичной фотографии лица.
Обеспечение правопорядка
Алгоритмы распознавания лиц широко используются, в частности, полицией США. Задержанные лица фотографируются, затем снимки сопоставляются с имеющимися базами данными и добавляются в них. Это позволяет повысить эффективность розыска преступников в дальнейшем.
Благодаря мобильной идентификации лиц появляется возможность сделать снимок смартфоном или планшетом, а затем сравнить полученные кадры с базами данных, идентифицируя попавших в объектив лиц.
Читайте также: Законность видеонаблюдения: где и с какой целью можно устанавливать видеокамеру
Аэропорты и пограничный контроль
В крупнейших аэропортах мира при прохождении пограничного контроля биометрическая идентификация все чаще используется для сокращения времени на выполнение регистрационных процедур. Многие путешественники уже имеют собственные биометрические паспорта, и для удостоверения личности им нужно лишь подойти к специальному сканеру.
Подобные технологии становятся актуальными в условиях, когда необходимо осуществлять контроль за огромными скоплениями людей, а ресурсы для этого ограничены, например на мировых спортивных мероприятиях, массовых демонстрациях и т. п.
Поиск пропавших без вести
От того, как работает система распознавания лиц, в немалой степени зависит эффективность розыска пропавших без вести, похищенных людей. Их добавление в базу данных позволяет получить сигнал сразу, как только соответствующие лица пересекут границу, таможню, появятся в торговом центре или на вокзале перед объективом видеокамеры.
Снижение хищений при осуществлении торговли
Системы распознавании лиц позволяют бороться с хищениями в магазинах. Лица, уличенные в совершении подобных правонарушений, добавляются в базу данных. Когда они оказываются в торговом центре, алгоритм идентифицирует злоумышленника. Специальная программа сообщает охранникам, что за данным человеком необходимо внимательно следить.
Повышение качества обслуживания в розничной торговле
Алгоритмы распознавании лиц способны оказать помощь покупателям в торговых залах. В частности, при оплате по терминалу система может выдавать покупателям предложения товаров и услуг на основе предшествующей истории покупок. В результате потребитель получает полезную информацию, а продавец – возможность увеличить чек. Также существуют технологии, позволяющие предотвращать образование длинных очередей, например Face Pay.
Банки и кредитные учреждения
Совершение банковских операций при помощи биометрической системы распознавания лиц позволяет повысить безопасность транзакций. Теперь вместо ввода одноразовых паролей программа сканирует лицо пользователя через камеру смартфона или банкомата, и при совпадении с базой данных разрешает совершение операции.
Возможность взлома с использованием фотографии клиента исключается, так как алгоритм оценивает витальность, то есть наличие движений, мимики лица перед камерой. Эти технологии в будущем позволят отказаться от подписей и дебетовых карт.
Маркетинг и реклама
В маркетинге технологии распознавания лиц позволяют персонализировать рекламу, предлагаемую аудитории. Например, на улице Пикадилли в Лондоне установлен рекламный щит, который определяет пол, возраст стоящего перед ним человека. В результате подросткам не могут рекламироваться табачные изделия или спиртные напитки, а пожилым людям предлагаются услуги стоматологической клиники.
Аналогичным образом, интеллектуальные алгоритмы могут фиксировать восприятие аудиторией той или иной продукции. Например, в сети пиццерий DiGiorno такие алгоритмы использовались, чтобы выяснить реакцию клиентов на новые виды пиццы. Также и в индустрии развлечений система распознавания лиц позволяет узнать, понравился ли зрителям фильм.
Здравоохранение
Медицинские учреждения применяют биометрическую систему распознавания лиц для оказания помощи пациентам. Эти системы используются не только для упрощения регистрации больных и доступа к их медицинским картам и историям болезни. Существуют алгоритмы, способные по внешним признакам выявлять симптомы определенных заболеваний, и эти результаты становятся основой для рекомендации пройти углубленное обследование.
Фирма AiCure создала приложение, которое позволяет контролировать прием пациентами лекарственных препаратов в соответствии с установленным врачом графиком на основе алгоритма идентификации лиц. Спрос на подобные технологии в здравоохранении будет расти по мере снижения стоимости их использования.
Контроль посещаемости студентами и персоналом
В Китае уже сейчас существуют университеты, которые используют системы распознавания лиц для контроля посещаемости студентами лекций. В бизнесе аналогичные алгоритмы позволяют контролировать рабочее время сотрудников организации, бороться с опозданиями и преждевременным уходом из офиса, с прогулами.
Распознавание водителей
Автопроизводители активно работают над внедрением системы распознавания лица человека, чтобы отказаться от использования ключей. Теперь угон станет сильно затруднен, поскольку водитель, лицо которого отсутствует в специальной базе данных, не сможет получить доступ к управлению автомобилем. Также эти программы могут помогать в настройке зеркал и сидений, мультимедиа систем на основе сохраненных в памяти программы предпочтений пользователя.
Читайте также: Сигнализация с помощью телефона: ключевые особенности, основные правила выбора
Принципы работы системы распознавания лиц
Сегодня используется три основных вида систем распознавания лица человека:
- Локальный контроль и обработка информации с видеокамеры на компьютере пользователя. Сфера применения подобных систем – пропускной контроль, где таким способом можно заменить вахтеров и контролеров. Помимо прочего, эти алгоритмы дают возможность отправить данные о приходе сотрудника на работу сразу в отдел кадров, что упрощает учет рабочего времени. В данном случае речь идет о системах местного контроля с ограниченным функционалом.
- Удаленный анализ видеоданных, поступающих с цифровых камер. В данном случае видеозапись с камер видеонаблюдения оправляется на удаленный сервер, на котором установлено специализированное программное обеспечение для интеллектуального анализа изображений.
- Анализ видеоданных в самой видеокамере. Обработанная информация передается на удаленный сервер почти в неизменном виде. Как правило, в связке камера-сервер присутствует программа, работающая с определенными моделями камер с интегрированной опцией распознавания (клиент-сервер). Подобные системы имеют высокую стоимость. Сэкономить позволяет использование локальной аппаратно-программной системы распознавания, которая установлена непосредственно в камере.
Требования к системам распознавания лиц в СКУД
К системам идентификации лиц предъявляются требования, на рассмотрении которых следует остановиться подробнее.
Время прохождения через турникет
Важнейший показатель для систем пропускного контроля, которые используются в учреждениях с большим количествам сотрудников. Суть в том, что в час пик плотность движения людей через пропускной пункт максимальна. Критическое значение приобретает время, которое тратится на распознавание одного человека. При медленной работе алгоритма неизбежно возникнет очередь, и система идентификации только добавит проблем.
На скорость срабатывания турникета влияют следующие условия в совокупности: длительность сканирования и оцифровки, отправка данных на сервер, составление шаблона, сравнение шаблона с полученным изображением, открытие турникета.
В идеале время на прохождение турникета не должно превышать 1,5 секунды. Для этого необходимо синхронное и оперативное выполнение всех перечисленных операций. Протокол RS-485 для этого не подойдет, необходимо использовать Ethernet. С его помощью можно легко масштабировать систему доступа и добиться максимальной скорости передачи информации по сети.