Биометрические данные человека что это
Биометрические персональные данные, нюансы и тонкости обработки
Применение биометрии как способа идентификации появилось еще в далеком 19-м веке. Английские колонизаторы ввели практику идентификации своих контрагентов из числа индийцев по отпечаткам пальцев и ладоней. Метод дорабатывался в дальнейшем, но применяется и по сей день. В этой статье мы попытаемся разобраться, что же относится к биометрическим данным и какие особенности обработки возникают у оператора при работе с данной категорией персональных данных.
Биометрические персональные данные, что это?
Для начала обратимся к определению, которое приводится в ст. 11 ФЗ-152 «О персональных данных». Биометрические персональные данные — это сведения, которые характеризуют физиологические и биологические особенности человека, и которые используются для установления личности субъекта ПД.
Исходя из разъяснений Роскомнадзора, к физиологическим данным относятся: дактилоскопические данные, радужная оболочка глаз, анализы ДНК, рост, вес, а также иные физиологические или биологические характеристики человека, в том числе изображение человека (фотография и видеозапись), которые позволяют установить его личность.
Например, цветное цифровое фотографическое изображение лица владельца паспорта является биометрическими персональными данными владельца документа. Эта норма закреплена в ПП РФ № 125 от 4 марта 2010г. Здесь речь идет о чипе внутри первой страницы биометрического паспорта (спасибо за поправки пользователю t12589645). В тоже время, необходимо принимать во внимание цель, которую преследует оператор при обработке персональных данных, но об этом чуть позже.
Особенности обработки биометрических персональных данных
Первое, что мы видим открыв ст. 11 ФЗ-152: « Обработка биометрических персональных данных может осуществляться только с письменного согласия субъекта ПД, в случае если данные используются для установления личности субъекта. Это основное отличие обработки данной категории ПД. В остальном оператор должен руководствоваться общими требования 152-ФЗ, к организации обработки персональных данных.
Из этого правила есть и ряд исключений, когда согласие на биометрию не требуется, они приведены в ч.2 ст.11. Письменное согласие не требуется в случаях, когда обработка данных производится в связи:
Цели обработки биометрических персональных данных
Биометрические персональные данные это сведения, которые характеризуют физиологические и биологические особенности человека,, и которые используются для установления личности субъекта ПД.
В Вашей организации используется система контроля управления доступа (СКУД) — это может быть таймформер или «аналоговый» вариант в виде сотрудника, который сверяет фотографию из базы данных и присутствующую на Вашем пропуске или паспорте. В данном случае используются фотографии, которые являются биометрическими данными, характеризующие физиологические особенности, и целью обработки является определение личности, предъявляющей пропуск. Согласно разъяснениям Роскомнадзора, фотографии и другие биометрические сведения(отпечатки пальцев и т.д.), используемые для обеспечения однократного и/или многократного прохода на охраняемую территорию относятся к обработке биометрических персональных данных.Такая процедура должна осуществляться только с письменного согласия.
Пример неправильной обработки биометрических персональных данных
Обратимся к Определению Верховного Суда РФ от 05.03.2018 № 307-КГ18-101
По итогам проверки Роскомнадзор выписал предписание организации(бассейну) с требованием прекратить использование фотографий клиентов на пропусках. Нарушение заключалось в отсутствии отдельного письменного согласия посетителей на обработку их биометрических данных, а именно фотографий.
Доводы приводимые оператором персональных данных, о том что:
Правильные цели обработки биометрических персональных данных
Достаточно тонкая грань, но при этом являющаяся очень значимым моментом, который может привести к штрафным санкциям,, поэтому рекомендуется систематически проводить внутренний аудит персональных данных.»
Личное дело сотрудника
Также биометрическими персональными данными не является фотография сотрудника, хранящаяся в личном деле и подпись работника. Т.к. все действия, которые совершает работодатель, используя данные из личного дела, направлены на подтверждение их принадлежности конкретному физическому лицу. При этом личность работника уже определена и его персональные данные уже имеются у работодателя.
Видеосъемка в общественных местах
В том случае, если на охраняемой территории или в публичных местах ведется видеосъемка, эти данные также не могут считаться биометрическими ПД, поскольку владелец видеокамеры не использует их для идентификации конкретного человека. Биометрическими эти данные могут стать, в случае передачи их в правоохранительные органы и если переданные видеоматериалы будут использоваться для определения личности конкретного физического лица.
На что стоит обратить внимание оператору организующему такую видеосъемку?
Оператор в таком случае должен проинформировать посетителей о том, что в данном месте ведется фото-, видеосъемка. Это может быть текстовая табличка или специализированная наклейка, специальных требований к оформлению не предъявляется. В том случае, если Вы выполнили это простое требование, то согласие посетителей на проведение таких мероприятий не требуется.
Если же Вы установили видеонаблюдение в рабочих помещениях, то не забудьте проинформировать работников об этом. Уведомлять нужно обязательно под роспись. Данное требования закреплено в Трудовом кодексе РФ ст. 74 и заключается в изменении условий трудового договора.
Цели организации видеонаблюдения
Повторю это еще раз, определение целей обработки – одна из ключевых задач оператора. И организация видеонаблюдения не является исключением. Цели должны быть определены заранее и иметь правовое обоснование.
Например, если видеонаблюдение ведется в офисе, то это может быть: «Фиксация возможных действий противоправного характера». В медицинских учреждениях или на производстве продуктов питания целью может быть: «Обеспечение прав пациентов, клиентов или потребителей». Наверняка, заказывая пиццу, Вы сталкивались с возможностью наблюдать за ее приготовлением по средствам вебкамер, направленных на рабочие места.
При этом данный процесс должен быть отражен во внутренней документации оператора. Должен быть определен ответственный, имеющий доступ к системе видеонаблюдения. Обычно это закрепляется приказом. Помимо этого необходимо предусмотреть порядок и сроки хранения видеозаписей, а также порядок их удаления. Само собой не забываем про информационные таблички.
Самое важное в одном абзаце
Подводя итог, еще раз хочется остановиться на самых важных моментах. Внимательно прочитайте ч.2 ст. 11 ФЗ-152 «О персональных данных» и во всех случаях, не попадающих под них, собирайте согласие на обработку биометрических персональных данных в письменном виде. Заранее определяйте цели обработки и строго придерживайтесь их. Не собирайте избыточную информацию. В случае, если Вы не знаете как трактовать то или иное требование закона, обратитесь к разъяснениям РКН или напишите им обращение с Вашим вопросом.
Видео про самые распространенные ошибки, оформлению Согласия на обработку персональных данных можно посмотреть на ютуб канале ПДМастер, также как и другие полезные материалы по тематике «Персональные данные».
Как работает Единая биометрическая система
С начала июля в некоторых банках начала работать единая биометрическая система, созданная «Ростелекомом» по инициативе Министерства цифрового развития, связи и массовых коммуникаций и Центрального банка РФ. В этом посте мы подробно расскажем, как работает новая система, а в комментариях постараемся ответить на ваши вопросы, связанные с ней.
Единая биометрическая система была создана, чтобы сделать более доступными услуги, которые требуют юридически значимого подтверждения личности — в первую очередь для жителей отдаленных регионов и маломобильных граждан. Сервис удаленной идентификации, в основе которого лежит Единая биометрическая система, позволяет получать банковские услуги удаленно, при наличии смартфона или компьютера с интернетом.
Какие данные используются
Мы обеспечиваем обработку и хранение первичных данных, а также проверку их соответствия. Оборудование для снятия биометрии закупают и обслуживают банки.
Как зарегистрироваться в системе
Для того, чтобы зарегистрироваться в системе, нужно один раз прийти в банк, который поддерживает услугу, и дать свое согласие на сбор биометрических данных. Регистрация биометрии добровольна. Вы в любой момент можете удалить свои биометрические данные, заполнив форму на портале Госуслуг, и дальше открывать счета, вклады или получать кредиты по старинке, через личное посещение.
В сборе биометрических данных помогает операционист банка. Данные привязываются к подтвержденной учетной записи Госуслуг. Для регистрации также потребуется оригинал паспорта и СНИЛС. Операционист фотографирует лицо пользователя и записывает, как он произносит выданную программой последовательность цифр.
Камера и микрофон, с помощью которых собираются данные, не является специализированным. Требования к оборудованию и данным подробно изложены в 321 Приказе Минкомсвязи от 25 июня 2018 г.
Библиотека для контроля качества собранных данных (БКК) проверяет и оценивает собранные в банках образцы до их отправки в Единую биометрическую систему. С помощью нашего модуля «Ассистент» для снятия биометрии можно убедиться, что при фотографировании соблюдены необходимые условия. В режиме реального времени «Ассистент» оценивает наклон головы, углы поворота, освещенность, положение глаз, в некоторых случаях – мимику человека.
Как пользоваться системой
Чтобы воспользоваться услугами банков, работающих с системой, нужно зайти на сайт/в приложение банка, авторизоваться через Госуслуги и дать согласие на передачу персональных данных в банк, а биометрических данных — в Единую биометрическую систему. Затем нужно произнести текст с экрана — обычно это случайная последовательность цифр. Чтобы убедиться, что перед камерой живой человек, система попросит пользователя повернуть голову, подмигнуть или улыбнуться.
Затем данные передаются в систему, сопоставляются с образцами, и если образец соответствует оригинальным данным, пользователь начинает работу с системой дистанционного банковского обслуживания.
О пересдаче биометрических данных
Изменение прически, отращивание бороды, ношение очков не влияют на распознавание человека системой. Тем не менее, биометрические данные необходимо обновлять каждые три года. Досрочное обновление данных необходимо, если пользователь сделал пластическую операцию на лице или получил травму. Обновить данные можно во всех отделениях банков, которые проводят сбор биометрии.
О стоимости услуги для клиентов и банков
Для пользователей Единая биометрическая система полностью бесплатна, банки же платят 200 рублей за каждого нового клиента, пришедшего с использованием системы. Эти деньги распределяются между «Ростелекомом», банком, который зарегистрировал человека, и вендорами биометрических технологий. Такое распределение стимулирует другие банки к активному сбору биометрии.
О доступе банков к биометрии
У банков нет доступа к биометрическим данным пользователей, все они хранятся централизованно в Единой биометрической системе. При дистанционной идентификации клиента банк видит только процент схожести образцов и на основании этого решает, оказывать услугу или нет. Чтобы банки могли подключать свои системы дистанционного банковского обслуживания к системе без проблем, мы разработали специальный API.
Об охране данных
О злоумышленниках
Безусловно, у всех биометрических алгоритмов есть свои недостатки и слабые места. Именно поэтому мы используем мультивендорный подход: взломать один алгоритм, может быть, и возможно, но когда их несколько и они постоянно меняются, сделать этого гораздо сложнее.
Помимо того, что система сравнивает контрольный шаблон с полученным во время идентификации, она параллельно запускает проверку видео с помощью других биометрических алгоритмов. Если один или несколько из них не идентифицировали гражданина, то в работу включается «модуль аномалий»: он анализирует причины расхождений и при обнаружении мошеннических действий направляет уведомление в банк. Такая проверка занимает всего несколько секунд.
Связка биометрической идентификации с идентификацией на сайте Госуслуг — это еще один барьер для злоумышленников. Кроме того, в мобильном приложении «Ключ Ростелеком» мы защитим канал связи между телефоном клиента и базой данных, чтобы информацию было невозможно перехватить.
Как воспользоваться системой
Приглашаем пользователей Хабра протестировать Единую биометрическую систему и рассказать о своем опыте. Для этого нужно зарегистрировать биометрические данные в одном из отделений (список на карте есть здесь). После успешной регистрации и привязки биометрии к вашей учетной записи на Госуслугах вы получите подтверждение возможности удаленной идентификации. На данный момент протестировать ее можно, есть открывать счет в Почта Банке через их интернет-банк или оформлять кредит в Хоум Кредит Банке на товары из магазина online-samsung.ru. В будущем количество сценариев использования будет, конечно же, увеличиваться.
Дополнительную информацию о системе вы можете узнать в приказе Минсвязи о биометрических данных. Или в комментариях — мы готовы ответить на ваши вопросы.
Биометрия и биометрические данные: что это такое и безопасно ли это?
Биометрические данные являются частью передовых технологий. Проще говоря, биометрия — это любые показатели, связанные с человеческими особенностями. Наиболее распространенными примерами биометрической системы распознавания являются отпечатки пальцев и технология распознавания лиц. Как новая технология, биометрические системы могут повысить удобство, заменяя пароли и помогая правоохранительным органам поймать преступников. Биометрические идентификаторы также выполняют функцию контроля доступа в безопасной среде, как физической, так и цифровой. Но первый вопрос, который вы должны задать: защищены ли мои биометрические данные от кражи?
Что такое биометрия и для чего используются биометрические данные?
Биометрия — это способ измерения физических характеристик человека для проверки его личности. Они могут включать физиологические признаки, такие как отпечатки пальцев и глаза, или поведенческие характеристики, которые оценивают уникальное поведение и подсознательные движения человека. Для того, чтобы биометрические данные были полезными, они должны быть уникальными, постоянными и собираемыми. После измерения, информация сравнивается и сопоставляется в базе данных.
Каждый раз, когда вы разблокируете экран смартфона с помощью функции распознавания лиц, запрашиваете у голосового помощника прогноз погоды или прикладываете отпечаток пальца на на какое-либо устройство, вы используете биометрические данные. Вы можете использовать эту технологию каждый день для идентификации личности или для взаимодействия с личным устройством, но существует множество других способов использования биометрических данных.
Например, полиция может собирать ДНК и отпечатки пальцев на месте преступления или использовать видеонаблюдение для анализа походки или голоса подозреваемого. В медицине применяется сканирование сетчатки глаза или проводятся генетические тесты. И даже ваша подпись относится к биометрическим данным.
Типы биометрических данных
Распознавание голоса. Измеряет уникальные звуковые волны в голосе во время разговора с устройством. Ваш банк может использовать систему голосового управления для проверки вашей личности при звонках.
Как работает биометрия?
Если вы когда-либо вставляли свой отпечаток пальца в устройство, то у вас возможно сложилось смутное представление о том, как работает биометрия. В основном, вы записываете свои биометрические данные в устройство, в данном случае отпечатки пальцев. Эта информация сохраняется, и к устройству можно будет получить доступ только после сравнения вашего отпечатка и сохраненного. Любой человек в мире может прикоснуться пальцем к сенсорному кругу вашего смартфона и вряд ли сможет разблокировать его.
Отпечатки пальцев — это всего лишь одна из форм биометрических данных. Одной из новых форм биометрической технологии является сканирование глаз. Обычно сканируют радужную оболочку. Почерк и голосовые отпечатки — это другие биометрические данные, которые являются исключительно вашими и иногда необходимы для обеспечения безопасности.
Биометрическая система состоит из трех различных компонентов:
Биометрические данные широко распространены на смартфонах, таких как iPhone Apple и некоторых устройств Android. Ноутбуки и другие вычислительные устройства все больше полагаются на биометрические системы, и эта тенденция только начинается. Биометрическая аутентификация и идентификация являются безопасным способом входа на устройства и в различные службы. Кроме того, это может снять трудности с запоминанием десятков паролей учетных записей.
Конфиденциальны ли биометрические данные?
Когда речь заходит о биометрических данных, существует серьезная озабоченность по поводу конфиденциальности. Некоторые из основных проблем, выявленных с помощью биометрических данных, включают в себя следующие:
Как защитить биометрические данные?
Для защиты биометрических данных, вы можете принять ряд мер по обеспечению их безопасности на основе здравого смысла:
Биометрические данные могут сделать мир более безопасным и удобным. Соблюдение принципов здравого смысла в области безопасности может сыграть важную роль в защите вашей частной жизни.
На видео: Биометрические данные в России
Биометрия в платежах – основы технологии
Сегодня мы постоянно слышим в новостях «запущен проект по распознаванию лиц на транспорте», «в кафе NN реализовано распознавание лиц для оплаты», «в компании ZZ организован проход в офис по лицу» и прочие «яркие» заголовки. Кроме того, многие люди привыкли к использованию FaceID на своих смартфонах. Но, как обычно, известное – не есть от того познанное. Начнём с основ, чтобы разобраться в предмете.
Факторы аутентификации
Аутентификация – подтверждение того, что «Я это Я». Все известные способы аутентификации субъекта (субъект – тот, кто действует) относятся к трем классам-факторам:
Фактор 1. То, что человек знает. Имеется в виду обладание уникальной или секретной, информацией: пароль, ответ на вопрос, дата рождения, номер паспорта и т.д.
Фактор 2. То, чем человек владеет. Речь идёт о владении каким-либо предметом, например, документом, ключом от автомобиля, пластиковой картой для прохода, брелоком и т.д.
Фактор 3. То, чем человек является. Под этим подразумеваются неотъемлемые естественные характеристики человека: лицо, отпечаток пальца, подпись (почерк) и многие другие
Мы будем говорить о последнем, третьем факторе аутентификации в применении к решению практических задач.
Что такое биометрия
Когда говорят «биометрия», то имеют в виду технологии, позволяющие измерять, классифицировать и сравнивать естественные, присущие каждому человеку, физические характеристики. В конечном итоге, всё это делается для распознавания человека среди множества других людей (идентификация) или дополнительное подтверждение того, что субъект является тем, кем он себя назвал (аутентификация). Короче говоря, биометрические технологии позволяют определить и подтвердить личность человека, основываясь на определённом наборе данных.
Какие данные могут быть использованы для достижения этой цели? Перечислю основные требования:
Универсальность: данные могут быть получены, или сняты, с любого человека, вне зависимости от возраста, роста, пола, и т.д.
Уникальность: получаемый набор данных должен быть уникальным для каждого человека, т.е. необходимо свести к минимуму вероятность нахождения двух разных людей с одними и теми же или близкими данными
Приведу несколько примеров характеристик, или биометрических модальностей, присущих всем людям, но при этом являющихся уникальными для каждого человека:
Отпечаток пальца
Лицо
Голос
Рисунок вен ладони
Радужка глаза
Почерк
Походка
Список можно продолжить. При этом в практических задачах, например, для идентификации личности при выполнении платежа или при прохождении паспортного контроля, важны дополнительные требования к биометрическим технологиям:
Скорость и простота сбора и обработки: данные должны собираться и обрабатываться достаточно быстро, весь процесс должен занимать секунду. Если процесс занимает больше секунды, это приводит людей в невообразимое раздражение потому, что люди уже привыкли к быстрой работе бесконтактных платежей
Стоимость датчиков для снятия биометрических данных и системы их обработки
Характеристики первых трёх биометрических модальностей из списка выше могут быть сняты и обработаны достаточно быстро и относительно просто. Например, для снятия рисунка вен необходим специальный прибор, который сегодня нельзя установить на каждый недорогой смартфон. Несмотря на то, что прибор этот (обычная камера, которая видит чуть шире, чем видимый диапазон) очень прост, ставить его на устройства не принято.
Кроме этого, следует отметить, что для уверенной работы алгоритмов распознавания какого-либо признака человека необходимо, чтобы этот признак был мало подвержен изменениям как с течением времени, так и при наличии различных помех. Например, испачкав палец в краске, им уже нельзя разблокировать устройство при помощи датчика отпечатка пальца; если голос осип, т.е. поменял свой тембр при простуде, становится временно недоступным распознавание человека по голосу.
Некоторые признаки человека крайне мало подвержены изменениям, например, рисунок радужки глаза практически не меняется при жизни человека. Лицо человека меняется со временем, но этот процесс достаточно медленный, и, как правило, непрерывный. Кроме этого, два этих признака (радужка и лицо) мало подвержены случайным изменениям, например, травмам, царапинам и т.д. Таким образом, можно добавить ещё одно требование к биометрическим характеристикам:
Устойчивость: данные должны быть неизменны со временем или изменяться очень медленно
Наконец, биометрические технологии можно разделить на контактные и бесконтактные, по принципу снятия данных. Например, при снятии отпечатка пальца, предполагается контакт между частью тела человека и поверхностью прибора, что не всегда удобно. Напротив, для записи голоса или создания снимка (фотографии) лица непосредственного контакта не требуется. Поэтому – ещё одно требование:
Удобство для пользователя: данные должны собираться простым и удобным для пользователя образом (желательно бесконтактно) и не требовать от
пользователя усилий для предоставления его биометрических данных
Таким образом, можно выделить шесть основных требований к биометрическим характеристикам: универсальность, уникальность, стоимость, простота сбора и обработки, устойчивость, удобство.
Остановлюсь на технологиях, позволяющих распознавать человека по лицу, т.е. лицевой биометрии, или facial recognition, поскольку данная биометрическая модальность удовлетворяет в достаточной степени всем выдвинутым нами требованиям.
Идентификация и аутентификация по биометрическим признакам
Важно понимать разницу между двумя понятиями: идентификацией и аутентификацией.
Под идентификацией понимают выделение или нахождение одного объекта среди множества похожих. Человек сталкивается с такой задачей регулярно, например, увидев на экране знакомое лицо актёра, человек сразу идентифицирует его, то есть узнаёт, находит его у себя в памяти, среди многих других знакомых лиц. Узнав актёра по лицу, мы сразу вспоминаем, например, список фильмов с этим актёром, возраст, имя и т.д. Иными словами:
Задача идентификации состоит в нахождении объекта по определённому признаку среди многих похожих между собой. Также такую задачу называют сравнением 1:N (один ко многим), где N – это общее количество объектов, по которым идёт поиск.
Под аутентификацией понимают подтверждение факта сходства полученной характеристики объекта с характеристикой, записанной ранее. То есть, получение ответа на вопрос “действительно ли перед нами Х”? Подобная задача тоже часто встаёт перед человеком: например, увидев на экране телефона имя звонящего “Y”, мы заранее предполагаем, что будем беседовать с Y, однако только услышав знакомый голос, то есть сравнив услышанное с тем, что есть у нас в памяти, мы убеждаемся, что говорим действительно с Y. Иными словами:
Задача аутентификации состоит в подтверждении достаточного сходства объекта со своим образом, записанным ранее. Также задачу называют сравнением 1:1 (один к одному).
Необходимо отметить, что полное сходство при биометрической аутентификации не может быть достигнуто, так как каждый человек одновременно и равен, и не равен самому себе. Улыбнувшись для фотоснимка один раз, потом невозможно повторить точно такую же улыбку: мельчайшие детали лица всё равно будут другими. Однако, это обстоятельство не мешает успешно проводить надёжную аутентификацию человека по лицу: установив достаточно высокий порог сходства для вынесения решения, можно добиться очень высокой точности.
Решение задачи распознавания и классификации изображений лица
В основе современных способов распознавания лица лежат технологии машинного зрения, позволяющие компьютерной программе самостоятельно без помощи человека распознавать и классифицировать определённые детали изображения. Например, возможно выделить человеческое лицо среди многих деталей на снимке (распознавание) и сравнить с уже имеющимися образцами лиц для установления возможного сходства (классификация).
Разработка отдельных алгоритмов распознавания объектов на изображениях началась ещё в 1960-х годах, но только ближе к концу 1980-х стало возможно использовать значительно возросшие вычислительные мощности для проверки идей, лежащих в основе алгоритмов, на практике. В XXI веке, а именно с середины 2010-х годов повсеместное распространение смартфонов, оснащённых камерами, сделало возможным резкое улучшение качества работы технологии в связи с огромным количеством исходных данных для алгоритмов (фотографий лиц) и устройств, способных выдавать результаты их работы. Согласно исследованиям компании Gemalto, с 2013 года было выпущено 500 моделей смартфонов, поддерживающих распознавание как минимум одной биометрической модальности, а общее количество платежей, произведённых с мобильных устройств достигло почти 2 миллиардов за 2017 год [1], т.е. можно говорить о повсеместном использовании устройств, поддерживающих биометрическую аутентификацию/идентификацию для платежей.
Весь процесс применения технологий машинного зрения к задаче идентификации человека по лицу можно разделить на три этапа:
Поиск лица на изображении (фотографии)
Выделение черт и характеристик лица для получения биометрического образца
Сравнение образца с хранящимися в базе, или поиск по базе образцов
Рассмотрим основные принципы алгоритмов, лежащих в основе каждого из этапов решения задачи.
Поиск лица на изображении
Алгоритм обладает следующими достоинствами:
Устойчивость: большое количество истинно-положительных ответов и очень малое количество ложноположительных
Возможность использования алгоритма только для решения задачи нахождения лица на фотографии, без идентификации/аутентификации пользователя
Работа алгоритма начинается с поиска определённых признаков на изображении: на рис.1 изображены 4 различных типа признаков. Значение, присваиваемое каждому из признаков, вычисляется следующим образом: берётся сумма величин всех пикселей светлой области и вычитается из суммы величин всех пикселей закрашенной области. Величиной пикселя может, например, выступать численное значение (номер) цвета, записанное в нём. Таким образом, значением, присвоенным признаку А, может быть разность между освещённостью (яркостью) правой и левой частями прямоугольника.
Пример прямоугольных шаблонов-признаков
Каким образом может быть такой принцип использован для поиска лиц на изображении? Все человеческие лица имеют более или менее похожие свойства, или черты. Поиск по подобному признаку позволяет найти эти черты на снимках:
Область носа всегда светлее, чем область глаз
Область глаз всегда немного темнее, чем верхняя часть щёк
шаблон-признак, похожий на нос
шаблон-признак, похожий на область глаз
Используя другие прямоугольные шаблоны-признаки, а также шаблоны-признаки разного размера можно составить карту местоположений и размеров черт лица: глаз, рта, носа, границ лица.
Приведём пример работы алгоритма: предположим, мы ведём поиск четырёх признаков с рис. 1 по изображению размером 100 на 100 пикселей. Изображение делится на 25 сегментов, размером 20 на 20 пикселей, и поиск черт ведётся шаблонами такого же размера. Мы поочерёдно накладываем каждый из шаблонов на участок изображения, смотрим получаемое значение, а затем записываем результат в таблицу:
На этой карте-таблице в ячейках записан тип шаблона, который получил наибольшее по модулю значение в данном сегменте, а также это значение. Видно, что в центральной части карты находятся сильно выраженные черты, соответствующие определённым шаблонам-признакам, например, весьма вероятно, что в центральной части изображения находится нос.
Вот таков базовый принцип составления карты черт лица на изображении. Можно заметить, что, во-первых, в нём не учитывается, что лица могут быть наклонены как в целом, так и частично, во-вторых, может потребоваться более, или наоборот, менее подробное разбиение изначального изображения, в-третьих элементы разбиения могут пересекаться, и т.д. Все эти замечания учитываются в современных подходах, например, используется большее число шаблонов, составляются более “сильные” классификаторы признаков, как линейные комбинации “простых, слабых” и т.д.
Получение биометрического образца из фотографии
После того, как лицо на фотографии найдено и выделено, можно говорить о переводе изображений лица в биометрический образец, т.е. в такую форму, в которой можно сравнивать её с другими по формальным критериям, автоматическим (машинным) образом. Очевидно, например, что простое попиксельное сравнение двух снимков вряд ли увенчается успехом – помимо различий в мельчайших деталях лица, обязательно будут иметь место различия в условиях съёмки. Поэтому необходимо выделять некий набор черт лица и сравнивать лица уже по этим чертам.
Приведу алгоритм, опубликованный в 1991 году [3], хорошо демонстрирующий основной принцип создания биометрического шаблона: “собственные лица” (по аналогии с собственными векторами).
Сначала формируется набор из изображений, которые используются для обучения, так называемый тренировочный набор. Изображения должны быть сняты в идентичных условиях: при одинаковом освещении, при одинаковом положении головы, и т.д. Также они должны иметь одинаковый размер, например, 100 на 100 пикселей.
Затем все изображения переписываются в векторном виде, то есть создаётся вектор-столбец, в котором записаны значения, взятые из пикселей (номера цветов); таким образом, векторы будут иметь 10 000 компонент каждый. Формируется матрица (таблица) T из вектор-столбцов. После этого необходимо вычислить “среднее” изображение и вычесть его из каждого из векторов-столбцов; можно сказать, что таким образом мы выделяем всё “общее” из каждого изображения и отбрасываем его, оставляя только отличительные черты.
Далее, составляется ковариационная матрица S (неформально говоря, отображающая зависимость изменения компоненты вектора от других компонент) и для неё вычисляются собственные значения и собственные вектора. На деле этот шаг – самый затратный с точки зрения вычислений, но он может быть упрощён поиском собственных векторов S без явного вычисления самой матрицы S.
Каждый полученный в нашем примере собственный вектор будет иметь 10 000 компонент, т.е. сам может быть “расшифрован” как изображение. Эти изображения и формируют базис “собственных лиц”. Т.е., каждое изображение из тренировочного набора, и вообще каждое изображение, удовлетворяющее изначальному формату, может быть теперь записано в форме:
Понятно, что 10 000 собственных значений – это слишком много, и их хранение и использование ничем не отличается от хранения 10 000 пикселей изначального изображения. Поэтому выбираются основные собственные значения и соответствующие им “собственные лица”. Выбор осуществляется сортировкой собственных значений по величине и установлением произвольного порогового значения t для их суммарной вариации, т.е.:
Иными словами, мы выбираем набор собственных значений такой, что их сумма будет значительной частью суммы всех собственных значений (можно установить значение t, например, 0.85). Значение k на практике оказывается относительно небольшим, например, для изображений 100 на 100, оно часто близко к 30.
Теперь можно говорить об основном наборе “собственных лиц”, который содержит наиболее значимые признаки всех лиц из тренировочного набора, а любое изображение лица как из тренировочного набора, так и извне, может быть разложено на компоненты – в виде взвешенного набора (линейной комбинации) “собственных лиц”. Т.е., любое изображение лица может быть представлено в виде вектора из, например, 30 компонент (а1, а1, …, а30). В таком виде его уже можно хранить и сравнивать с другими по формальным критериям, это и будет биометрический образец.
Следует дополнительно отметить два момента: во-первых, не имея доступа к набору “собственных лиц”, нельзя воссоздать изображение лица по биометрическому образцу. Во-вторых, “собственные лица”, переведённые в изображение, не всегда даже и похожи на лица в обычном понимании:
пример “собственных лиц” от AT&T Laboratories
Данный алгоритм, безусловно имеет свои недостатки, например, почти всегда главными собственным значениями становятся те, которые отвечают за освещённость, он плохо справляется с выражениями лица, очень зависит от условий съёмки. Однако, он хорошо показывает общий подход к формированию биометрических образцов по изображениям лица.
В современных решениях по идентификации человека по лицу используются, в основном, подходы, основывающиеся на глубоком обучении (deep learning), в которых многие шаги выполняются неявно при помощи нейронных сетей, к примеру, составление набора черт лица, взвешенный набор которых и будет составлять биометрический образец. Поэтому алгоритмы в целом, и форматы образцов в частности, варьируются от решения к решению; многое определяется качеством (разнообразием, величиной) набора лиц, на котором обучается решение, архитектурой нейронной сети и другими параметрами.
Поиск и сравнения в базе биометрических образцов
Как я уже писал, биометрический образец представляет собой вектор характеристик лица, на данный момент у многих известных решений он состоит из порядка 100 компонент (значений). Иными словами, биометрический образец являет собой точку в, допустим, 100-мерном пространстве. Теперь, каким образом, сделав снимок на камеру смартфона, можно определить, какой человек изображён на фотографии?
Сперва с фотографии выделяется изображение лица человека, затем изображение переводится в биометрический образец-вектор. Затем вектор пересылается на сервер распознавания, где хранятся записи образцов для разных пользователей. Если представить себе образец как точку в 100-мерном пространстве, то вопрос “какой человек изображён на снимке?” эквивалентен вопросу “какая точка является ближайшей к данной для сравнения?”. Близость между точками может определяться разными способами, в зависимости от алгоритма, например, это может быть обычное евклидово расстояние между точками. Таким образом, найдя ближайшую точку (ближайший вектор) к данной для сравнения, мы будем знать, на кого более всего похож человек, лицо которого изображено на фотографии.
Для каждого пользователя в базе может храниться несколько образцов для последующего сравнения, тогда можно говорить о попадании вектора в некую область 100-мерного пространства, отождествляемую с определённым пользователем. Таким образом, можно ответить на вопрос “является ли человек тем, за кого себя выдаёт?”, т.е. произвести аутентификацию. На нашем языке вопрос будет звучать как “попадет ли вектор-образец в нужную область?”.
В следующей статье я рассмотрю способы оценки решений, а именно, как посчитать, какой алгоритм лучше справляется с задачей идентификации и аутентификации.
Никита Лукьянов
аналитик-разработчик Департамента Инноваций НСПК