Что нужно знать о технологии распознавания лиц
Для государства распознавание лиц — важная часть системы безопасности и внушительная статья бюджета. Для журналистов — либо панацея, либо орудие мирового заговора. Для бизнеса — инструмент или продукт. Чью сторону ни прими, базовые вопросы всё равно остаются. Ответы на них пользователи привычно ищут в интернете (в среднем 28 704 запроса по тематике face recognition в месяц), но обнаруживают далеко не всегда. Исправляем ситуацию.
Что же такое распознавание лиц
Отделим мух от котлет. Пользователи чаще сталкиваются с распознаванием лиц в собственных смартфонах, где биометрическая идентификация применяется, чтобы разблокировать устройство и получить доступ к данным мог только его владелец. В процессе распознавания обязательно участвует 3D-камера, чтобы невозможно было обмануть гаджет фотографией.
Ещё существует идентификация лиц в реальном времени и реальных же условиях: в этом случае она неразрывно связана с системами видеонаблюдения, где лица буквально «выхватываются» из снимаемого камерами видеопотока.
Представим себе качественную современную камеру видеонаблюдения, размещённую чуть выше среднего человеческого роста в хорошо освещённом месте. Перед ней каждый день проходит примерно одинаковое количество примерно одних и тех же людей. Двигаются они не очень быстро.
Снятое видео может храниться в облачном архиве. К камере подключается аналитический модуль: сложное сочетание алгоритмов (искусственный интеллект, нейросети, вот это всё) плюс пользовательский интерфейс. Модуль «выхватывает» лица из видеопотока, определяет пол и возраст и заносит данные в базу.
Постепенно изображений становится больше. Система запоминает все распознанные лица автоматически и заносит их в архив, а пользователь с допуском указывает дополнительные данные: имя, должность, статус, прочие отметки («VIP-гость» или «вор»). Можно загрузить фото нужной персоны, а модуль найдёт в архиве все детекции этого лица.
Как только человек с отметкой вновь проходит перед камерой, система фиксирует это как важное событие и отправляет push-уведомление заинтересованным пользователям.
Детекция в контексте распознавания лиц — это ситуация, когда алгоритм в принципе понял, что перед ним лицо, а не яблоко или русалка с кружки Starbucks. Вычислительные мощности ему сначала требуются для этого, и только затем он может сопоставить лицо с базой или запомнить.
Если вы дочитали предыдущие несколько абзацев до конца, поздравляю, теперь вы знаете, как работает распознавание лиц в идеальной ситуации. Описание подходит к любой системе: от тех, которые используются в московском метро, до решений для малого бизнеса.
Главное, что нужно понимать: идеальную ситуацию в реальной жизни создать сложно, особенно если речь идёт о целом городе, а не офисе или магазине. Скажем, в метро людей много, все разные, ходят быстро. Камер нужно очень много, они стоят денег, размещать их должны грамотные специалисты.
Можно ли обмануть алгоритм распознавания лиц
Несмотря на случающиеся промахи, точность машинного распознавания уже нередко превосходит ту, с какой определяют лица люди. В Китае скоро появится система, способная найти конкретного человека среди 1,3 миллиарда других жителей за 3 секунды с точностью 90%.
И всё же однозначно на этот вопрос ответить сложно, потому что единственного идеального алгоритма распознавания лиц не существует. Большие очки, наклеенная борода, кепка, высокая скорость перемещения, специальный макияж (например, нарисованная на лице решётка) — всё это способно запутать алгоритм. Особенно в совокупности, потому что для распознавания бывает достаточно 70% открытого лица. А теперь представьте, что использовать вышеперечисленные ухищрения необходимо в условиях реального города. Звучит не так уж просто, верно?
Возможно ли распознавание лиц онлайн
Интернет — место парадоксальное: люди здесь одновременно могут беспокоиться о том, не определяет ли каждая вторая камера на улице их личность, и искренне хотеть «распознавать лица других людей по фотографии онлайн». Рассмотрим это направление face recognition отдельно.
Программа распознавания лиц — это либо описанный выше аналитический модуль (камера видеонаблюдения + софт + облачное хранилище), либо софт, аналогичный известному (слегка скандально) сервису FindFace. Сегодня скачать программу распознавания лиц «бесплатно и без регистрации» в подавляющем большинстве случаев, понятное дело, невозможно.
Веб-сервис FindFace.ru, помогающий найти людей в социальной сети «ВКонтакте» по их фотографии, был основан 18 февраля 2016 года. Помимо прочего, благодаря ему все желающие могли находить профили девушек, снимавшихся в порнофильмах. Очень скоро сервис стал использоваться для множества флешмобов по обнаружению лиц, которые имели полное право никогда и никем обнаруженными не быть. Разразился скандал, сработавший как вирусная реклама: технология, которая легла в основу сервиса, получила ряд престижных наград и вызвала интерес заказчиков со стороны государства и бизнеса. С 1 сентября 2018 года сервис более не оказывает услуги поиска людей по фотографии, так как он был преобразован компанией NtechLab в линейку решений для различных отраслей бизнеса.
Мечта пользователя, который вводит запрос, очевидно, выглядит так: заходишь на сайт, загружаешь фото человека, снятого украдкой в метро, программа распознаёт лицо и выдаёт ссылку на профиль в соцсети. Ага, попался! Или же так: загружаешь программу на компьютер, подключаешь к ней веб-камеру и распознаёшь мордочку своего кота. Успех — теперь тебе будет приходить уведомление каждый раз, когда кот ворует сосиски.
Реальность жестока. Первый же сайт, который предлагает вам подобное, отказывается работать, а второй — требует навыков программирования на Python. Более-менее похожее на мечту приложение называлось SearchFace, которое недавно перезапустилось под названием FindClone. Вы загружали фотографию, а алгоритм пытался распознать это же лицо в базе социальной сети «ВКонтакте». Ссылок на профиль приложение не выдавало, только сами снимки — причём неважно, кем они были загружены. Если пользователь давно активен в соцсети, выдача фото создавала жутковатый «биографический» эффект, если же нет, распознанные изображения могли рассмешить.
Собственно, пример SearchFace наглядно отвечает на вопрос «Как социальные сети используют распознавание лиц?». Точнее было бы cформулировать его таким образом: «Как социальные сети используются для распознавания лиц?» Ответ прост: как база данных. Неисчислимое количество уникальных сочетаний цифр (а именно так для алгоритмов Facebook*, «ВКонтакте» и остальных выглядят лица на фото) формирует базу для обучения нейросетей, которые ложатся в основу того или иного решения face recognition.
Решения все разные, и нейросети разные тоже, а детали и технические особенности заказчики и поставщики сервисов, как правило, не разглашают. В частности, пол и возраст модуль распознавания умеет определять благодаря тому, что может учиться на информации, содержащейся в «Одноклассниках», «ВКонтакте», Instagram* и Facebook*.
Как программируется распознавание лиц
Никогда не надо отвечать на вопросы разработчиков и для разработчиков, если ты не разработчик. Поэтому за помощью мы обратились к специалисту.
Распознавание лиц (а также другие связанные операции) — это достаточно типовая задача. Поэтому многие компании предоставляют готовые сервисы в виде облачных API (программных посредников между приложениями) для качественного решения этих задач. Кроме IT-гигантов вроде Microsoft и Google, распознаванием лиц занимаются также специализированные компании, в том числе российские. Их продукты стремительно развиваются и предоставляют ещё более интересные функции, такие как идентификация лиц и силуэтов в толпе.
Самому с нуля натренировать нейронную сеть намного сложнее. Нужен большой и качественный набор исходных данных, то есть десятки и сотни тысяч (а лучше ещё больше!) фотографий людей. Кроме того, понадобятся существенные вычислительные ресурсы и знания в области ИИ и машинного обучения. Крупные компании располагают всеми этими средствами, поэтому решают задачу намного лучше.
Также существует промежуточное решение — использовать уже натренированную нейросеть, например OpenFace. Такой вариант, скорее всего, будет работать чуть хуже, чем готовый облачный сервис, однако позволит иметь полный контроль над системой. При этом потребуется определённый уровень понимания работы нейросетей и нейросетевых фреймворков и, по всей видимости, некоторое знание языка Python, который завоевал популярность как основной язык программирования среди специалистов Data Science.
Действительно, на нём удобно проводить различные эксперименты, визуализировать данные и производить эффективные матричные вычисления благодаря прекрасному пакету NumPy. Это не самый лучший язык для промышленной разработки, поскольку он не содержит эффективных средств для создания больших безопасных программных систем, однако альтернатив ему в области обучения глубоких нейросетей пока нет.
Как работает распознавание лиц в бизнесе
Востребованность face recognition в финтехе, ретейле и других видах бизнеса напрямую связана с повышением доступности технологии. Механика проста: на всех предприятиях и во всех организациях стоят камеры видеонаблюдения, которые используются как инструменты для сбора данных и последующей аналитики. В мире системы наблюдения снимают за месяц терабайты видео в формате Full HD, то есть информации для обработки накапливается действительно много.
Необходимое ПО для анализа данных может «прошиваться» на устройство производителем. Камеры с видеоаналитикой «на борту» стоят обычно довольно дорого.
Альтернативный вариант — аналитика в облаке, то есть удалённом дата-центре, которая подключается к любой недорогой камере. Это на порядок дешевле плюс даёт гибкость — можно адаптировать решения под конкретный бизнес.
Популярность технологии распознавания лиц в разных сферах деятельности возрастает. К примеру, Сбербанк — один из лидеров в части анонсирования различных громких проектов face recognition, и поспорить с ним в этом плане может разве что «Тинькофф». В 2017 году Сбербанк приобрёл 25,07% компании VisionLabs, создающей софт для распознавания лиц. За 2018 год финансовое учреждение успело протестировать face recognition в московском метро и даже поймать 42 преступника, протестировать банкоматы с идентификацией лиц, чтобы злоумышленники не могли снимать деньги с чужих карт, а также объявить сбор биометрических данных (аудиозапись голоса, видеозапись лица) клиентов. В апреле этого года Сбербанк получил контроль над разработчиком систем распознавания голоса и лиц — «Центром речевых технологий» (ЦРТ).
Другое дело, что анонсировать, тестировать, пилотировать и покупать решения — не значит собственно внедрять. Что именно сейчас реально используется в Сбербанке (и используется ли), сказать с уверенностью на самом деле может только Герман Греф.
С розничной торговлей всё прозрачней. По сути, здесь есть три проблемы, которые распознавание лиц решает.
Во-первых, воровство. В магазинах орудуют мошенники, причём нередко одни и те же люди в одной и той же сети. Face recognition позволяет определять «дрейфующих воришек» и других людей, ранее нарушавших порядок. Как только однажды занесённый в базу нарушитель зайдёт в магазин, охрана получит уведомление в мессенджере или другим удобным способом.
Во-вторых, трудность работы с постоянными клиентами. Данных о покупках и днях рождения, чтобы персонализировать предложения для VIP-клиентов и фанатов бренда, попросту не хватает. Распознавание лиц можно интегрировать с CRM — то есть софтом, в который менеджеры заносят всю информацию по всем сделкам организации. В случаях с ворами и VIP распознавание лиц работает примерно одинаково: лицо заносится в чёрный или белый список, и при его повторном появлении система просигналит человеку с доступом. Пол и возраст определяются автоматически, а дополнительную информацию добавит ответственный сотрудник.
В-третьих, идентификация лиц в ретейле используется для таргетированной рекламы. К примеру, в некоторых магазинах X5 Retail Group установили камеры для распознавания выражения лица и возраста покупателей. Анализируя эти данные, система выводит на экран монитора в торговом зале товары, которые могут понравиться человеку. Ещё живая иллюстрация — кейс Lolli & Pops, большого кондитерского магазина в США. Система face recognition определяет постоянных покупателей и посылает на их смартфоны уведомления с товарами, которые могут им понравиться (с учётом индивидуальных предпочтений и даже аллергии на продукты).
Ещё один яркий пример использования технологии в ретейле — магазины без продавцов и касс. Например, Alibaba Tao Cafe — это кафе и магазин самообслуживания, расположенный в Ханчжоу. Здесь продаются напитки, закуски, продукты, игрушки, рюкзаки и тому подобное. Tao Cafe открыт только для пользователей сайта Taobao.
При покупке напитков система камер с поддержкой распознавания лиц автоматически идентифицирует клиента, связывается с его аккаунтом в интернет-магазине и обрабатывает платёж. Покупатели выходят через помещение, оборудованное несколькими датчиками, которые идентифицируют как клиента, так и товары. Сканирование работает, даже если человек положил покупку в карман или сумку.
Как развивается технология распознавания лиц
Системы видеонаблюдения с идентификацией лиц действительно захватывают мир. В Москве количество камер в 2019 году достигнет 174 тысяч. Это вовсе не значит, что все эти устройства по умолчанию могут распознавать личность: чаще всего сообщается о 160 тысячах камер с этой функцией. Тем не менее в конце 2018-го московская мэрия заявляла о намерении заменить все устройства видеонаблюдения и сформировать полностью инновационную систему в следующем году.
Парадокс в том, что 160 тысяч — это не так уж и много. Особенно если сравнивать с другим лидером запросов поисковиков по тематике распознавания лиц — Китаем. Там в конце 2017 года было более 170 миллионов камер видеонаблюдения и за три ближайших года планировалось подключить к сети еще около 400 миллионов.
Грамотное и корректное использование face recognition работает в первую очередь на повышение безопасности и комфорта. Люди обычно быстро проникаются доверием к технологиям, которые избавляют их от очередей на футбольный матч (улыбнулся камере — прошёл), предотвращают воровство и хулиганство или помогают меньше тратить на покупки (программы лояльности). Всё это, понятное дело, требует определённого регулирования — именно для этого принимаются законы о защите персональных данных.
В будущем, вероятно, сфера распознавание лиц в системах видеонаблюдения будет регулироваться аналогично текущей практике работы с идентификацией лиц в интернете. Стремящиеся к конфиденциальности люди просто не загружают в Сеть лишнего — частичное фиаско сервиса SearchFace доказывает, что такая стратегия эффективна.
Конечно, нельзя бесконечно ограничивать себя в прогулках по улицам, где камеры установлены на каждом перекрестке, однако возможность сохранить анонимность сформируется, если будет соответствующий запрос от общества.
*Деятельность Meta Platforms Inc. и принадлежащих ей социальных сетей Facebook и Instagram запрещена на территории РФ.
Лучшие предложения
Находки AliExpress: самые интересные и полезные товары
10 полезных товаров дешевле 500 рублей
Находки AliExpress: 20 полезных товаров дешевле 1 000 рублей
Новый год как в детстве: 6 праздничных традиций, которые поможет соблюсти техника Gorenje
Отборные скидки до 64% от AliExpress, Redmond и других магазинов
15 стильных пуховиков стоимостью от 3 000 до 15 000 рублей
10 наборов для вышивания, с которыми захочется заняться рукоделием
12 комфортных дутиков для зимних прогулок
Обзор TECNO Spark 30 Pro — доступного смартфона, который не выбеливает селфи
12 идей подарков на «Мегамаркете» для тех, кто участвует в «Тайном Санте»
Обзор TECNO Phantom V Flip 2 5G — новой раскладушки, которая почти вдвое дешевле аналогов
Брать или не брать: хитрый тест для самых бережливых