Оплатить покупку лицом, просто посмотрев в камеру на кассе. Пройти в метро или автобус без билета: система распознавания сама определит наличие у вас проездного или просто спишет деньги со счета. Запретить ребенку смотреть телевизор, пока родителей нет дома: экран не включится, зафиксировав в кресле напротив «блокированное» лицо. Это лишь немногие из возможных коммерческих применений технологии распознавания лиц, которая еще несколько лет назад использовалась лишь госорганами и спецслужбами. Теперь же количество собранных цифровых портретов в руках частных корпораций многократно превосходит наработки спецслужб. Пока на фоне протестов в США крупные технологические компании вдруг заявляют, что больше не будут разрабатывать и продавать государству программное обеспечение для распознавания лиц, на этот рынок ежемесячно выходят десятки новых компаний и стартапов по всему миру, не связанных никакими обязательствами. С функцией сканера лица уже продаются почти все флагманы мировых производителей смартфонов, а в московском метро полным ходом продолжается установка камер на каждом турникете — и на вход, и на выход. За всеми этими процессами стоит грандиозный прогресс систем обработки данных и искусственного интеллекта, и, похоже, никого не волнует, что еще чуть-чуть — и понятие анонимности билета или даже просто свободной прогулки пропадет навсегда. Будет ли возможно, например, зайти в общественный транспорт, чтобы система автоматически не соотнесла вас с паспортными данными? Учитывая стремительную автоматизацию платежных систем и привычек, не станет ли технология распознавания неизбежным спутником любых коммерческих операций и кто выиграет в мире, где деньги за все списываются автоматом?
Первопроходцы против
Наибольшее волнение у жителей развитых стран вызывает не применение технологии спецслужбами и полицией, а ее бесконтрольное внедрение всеми возможными компаниями. В прошлогоднем опросе Pew Research Center в США лишь 15% респондентов посчитали недопустимым использование распознавания лиц органами безопасности, но уже 41% был против контроля работодателем времени прихода сотрудников на работу, а более 67% были против попадания технологии в руки рекламодателей. Сторонники общественного внедрения системы неизменно напирают на безопасность: мол, если вы ничего не нарушали, вам нечего бояться. Однако сколь бы ни были эффективны такие системы (хотя данные в таблице не демонстрируют заметной корреляции) в борьбе с преступностью, эксперты по всему миру обеспокоены другим — отсутствием адекватных законов, регулирующих как собранные данные, так и саму технологию. В июне, после того как весь мир на карантине вдруг осознал современные возможности технологической слежки, масштабные дебаты по этому поводу развернулись в США и ЕС.
В компаниях Amazon, IBM и Microsoft призвали власти задуматься о том, как регулировать эту прорывную и быстрорастущую технологию. А Бостон стал вторым после Сан-Франциско крупным городом, где ввели полный запрет на распознавание лиц. Демократы представили в Конгрессе законопроект, который запретил бы федеральным агентствам использовать технологию, а штатам и муниципалитетам максимально усложнил бы ее внедрение. Интересно, что еще в начале года, когда в Евросоюзе говорили о планах ввести пятилетний запрет на всю технологию (тогда идею поддержали в Google), в Microsoft выступали резко против таких мораториев. После протестов в США политический уклон пошел именно в использование технологии полицией, но если она уже есть почти в каждом смартфоне, то с чем вообще собираются бороться? Ни Apple, ни IBM, ни NEC (один из лидеров в технологиях распознавания) не собираются сворачивать коммерческие разработки.
К тому же объявившие мораторий американские гиганты далеко не лидеры в списке поставщиков технологии полицейским. Японские NEC и Ayonix, немецкая Cognitec и другие компании уже заявили, что продолжат сотрудничать со службами безопасности США. Среди них и австралийская iOmniscient, которая производит системы, способные анализировать поведение людей в толпе. Они уже внедрены компаниями и правительствами более чем в 50 странах и использовались в том числе во время протестов в Гонконге. NEC поставляет подобную технологию лондонской полиции.
Технологии дискриминации
Известно, что половина совершеннолетних американцев еще в 2016 году находилась в полицейских базах данных распознавания лиц, а сама технология давно используется в любых расследованиях преступлений. В сеть неоднократно просачивалась информация об использовании автоматического сканирования иммиграционными службами фотографий всех въезжающих на территорию США, а в штате Мэриленд иммиграционные службы без всякого ордера просканировали фотографии из базы данных всех водительских удостоверений, также использовав технологию распознавания лиц. Все это свидетельствует о полнейшей правовой неопределенности новой технологии. На фоне недавних протестов многие в США вспомнили, что технология распознавания лиц использовалась для отслеживания и арестов протестующих в Балтиморе еще в 2015 году, а в последние недели министерство национальной безопасности США следило за протестующими в 15 городах с помощью дронов, в то время как камеры полицейских, оборудованные технологией распознавания лиц, фотографировали митингующих. Местные активисты и общественные организации много лет говорили об опасности технологии, в том числе из-за возможных ошибок в распознавании и, как следствие, дискриминации по расовому и гендерному признаку.
За это критиковали, в частности, программное обеспечение Rekognition, запущенное в 2016 году подразделением облачных вычислений Amazon Web Services (AWS). Независимые исследователи выявили в ПО множество ошибок в распознавании, которые привели к задержанию невиновных людей. Ученые также выяснили, что система особенно часто ошибается при распознавании женщин с темным цветом кожи. По некоторым исследованиям, афроамериканцы и азиаты неверно распознаются в сто раз чаще, чем белые, а особенно плохо обстояли дела с американскими индейцами.
На веб-сайте Amazon утверждается, что ее система распознавания лиц «обеспечивает высокоточный анализ и возможности поиска, которые можно использовать для обнаружения, анализа и сравнения лиц в самых различных случаях проверки пользователей, подсчета людей и обеспечения общественной безопасности». Теперь, спустя пять лет, Amazon вдруг ввел мораторий на использование технологии, сделав исключение только для поиска пропавших детей и контроля за незаконной миграцией. При этом в самой компании оправдываются, что точно не знают, в каких масштабах и целях полиция использовала их технологию ранее, и спешат предложить собственные проекты по регулированию систем распознавания. Но и они встречаются скептиками с опаской из-за возможного лоббирования компанией своих интересов.
В США, где де-факто признаны неконституционными даже стационарные камеры контроля скорости, десятилетиями используется гражданский полицейский контроль, а последние попытки установить такие камеры провалились еще десять лет назад. Поэтому правовой статус распознавания лиц действительно будет очень серьезной проблемой страны в ближайшие годы и окажет сильное влияние на то, как ИТ-бизнес будет развиваться дальше. Проблема и в том, что в эру соцсетей миллиарды людей сами слили в открытый доступ свои фотографии, дав корпорациям отличную возможность поупражняться в распознавании лиц на бесплатной базе данных, тем самым совершенствуя технологию.
Биометрический лагерь
В то время как правоохранительные органы специально используют технологию для мониторинга предполагаемых угроз и прогнозирования преступного поведения, возможности распознавания лиц гораздо более обширны. Уже сейчас ее нельзя рассматривать в отрыве от биометрии в целом. Программное обеспечение уже может контролировать людей с помощью комбинации биометрических (измерения физических и поведенческих характеристик), антропометрических (измерения характеристик тела) и физиометрических (измерения параметров организма, таких как частота сердечных сокращений, кровяное давление) показателей. В разгар пандемии COVID-19 многие компании начали разрабатывать бесконтактные биометрические устройства, управляемые с помощью технологии распознавания лиц, а в некоторых телевизорах функция распознавания лиц уже определяет, кто из членов семьи находится за экраном, и предлагает индивидуальный контент каждому.
Технология распознавания лиц приобрела популярность у пользователей в 2017 году, когда Apple выпустила iPhone X с функцией Face ID. Тогда же Дональд Трамп разрешил использовать технологию для идентификации всех, кто путешествует за границу: в первоначальной версии распоряжения американского президента граждане США могли отказаться от процедуры сканирования лица в аэропортах, однако позже она стала обязательной и для американских граждан. Подобные система распознавания применяют и в американских школах. Технологические компании уже интегрировали технологию в свои платформы и устройства, что пока позволяет пользователям снимать блокировку телефона и отмечать друзей на фотографиях. В прошлом месяце Apple анонсировала, что планирует внедрить распознавание лиц в камеру безопасности с поддержкой системы HomeKit и умные дверные звонки. Функция будет сопоставлять тех, кто звонит в дверь, с теми, кто отмечен в вашей ленте фотографий — и система сообщит вам, кто из друзей пришел в гости. Похожие функции предлагают умные камеры Google Nest и другие системы безопасности.
Одна из наиболее значимых американских компаний, специализирующихся на технологии распознавания лиц, — Clearview AI. Среди первых ее инвесторов был Питер Тиль, стоявший за успехом Facebook, сооснователь PayPal и стартапа Palantir, поддерживаемого ЦРУ. Технологии Clearview AI позволяет полиции и частным компаниям не только соотносить распознанные лица с базой персональных данных в режиме реального времени, но и использовать очки дополненной реальности, с помощью которых можно распознавать всех людей, которых видит пользователь. База данных компании включает в себя три миллиарда фотографий (для сравнения: в базе данных ФБР всего 641 млн фотографий). Свою базу данных Clearview AI составила на основе миллиардов фотографий из социальных сетей (например, Facebook и Twitter), не всегда соблюдая их политику использования персональных данных. База данных Clearview доступна полиции США, и технология компании только за последний год использовалась более чем в 600 правоохранительных ведомствах США. В ответ на юридические претензии ИТ-платформ, у которых компания без разрешения взяла три миллиарда пользовательских фотографий, глава Clearview Хоан Тон-Тат заявлял, что согласно первой поправке к Конституции США у компании есть право на использование фотографий, поскольку они опубликованы в открытом доступе.
«Когда мы думаем обо всех этих, казалось бы, безобидных способах использования наших фотографий, мы должны помнить, что не существует законов, которые нас защищают. Так что эти фотографии могут быть использованы против нас», — считает Мутале Нконде, сотрудник Гарвардской юридической школы.
Камера как детектор лжи
В последние десять лет крупнейшие мегаполисы мира столкнулись с экспоненциальным ростом количества камер — например, камеры установлены уже на каждом московском подъезде, что, по словам мэра столицы Сергея Собянина, способствовало повышению безопасности в городе. Москва, кстати, входит в топ-20 городов мира по количеству камер в пересчете на население. При этом первая десятка — китайские города. Только в Шанхае уже установлено более трех миллионов камер. Для сравнения: по итогам прошлого года в Москве было около 170 тыс. камер (см. таблицу). По оценкам, в Китае сейчас действует до 626 млн камер — по одной камере на двух граждан страны. Власти города Шэньчжэнь в ближайшие годы планируют увеличить число камер почти до 17 млн (сегодня их около двух миллионов).
В начале этого года в Москве запустили новую систему распознавания лиц в видеопотоке, которая задействует установленные в городе камеры. С ее помощью можно в режиме онлайн найти лицо в толпе и сразу же сравнить его с фотографиями людей из полицейских баз данных. Систему разработала российская компания NtechLab, ранее создавшая мобильное приложение FindFace для поиска людей по фотографиям в социальной сети «ВКонтакте». Московское правительство заплатило компании за ее систему распознавания лиц как минимум 3,2 млн долларов.
После мегаполисов умные камеры будут внедрять на границах. В Венгрии, Латвии и Греции уже тестируют систему пограничного контроля с использованием технологии распознавания лиц и жестов iBorderCtrl — проект обошелся Евросоюзу в 4,5 млн евро. Фактически речь идет о детекторе лжи под видом камеры. Граждане, пересекающие границу, должны загрузить в систему сканы виз, паспортов, информацию о наличии у них денежных средств, а затем через веб-камеру ответить на вопросы виртуального пограничника. Система анализирует микрожесты пользователя, чтобы понять, говорит ли тот правду. Тем, кого iBorderCtrl заподозрит в обмане, придется пройти дополнительный контроль на границе.
Ожидается, что объем мирового рынка технологий распознавания лиц составит 12,92 млрд долларов к 2027 году, с 2020-го по 2027-й он будет ежегодно расти в среднем на 14,8%. Удобство использования, которое многие ценят в пользовательских устройствах с функцией распознавания лиц, сильно контрастирует с растущим давлением и призывами усилить регулирование или даже запретить правительствам использовать технологию. Что касается самой технологии, то протест крупнейших корпораций мало на что влияет — существуют сотни небольших компаний, которые только выиграют от принципиальной позиции Amazon и других. В том же Китае никаких правовых дебатов не проводится — технология массово и стремительно внедряется.
Выделим несколько наиболее быстро развивающихся сфер применения технологии распознавания лиц.
Платить лицом
С тех пор как Apple выпустила iPhone с Face ID, другие производители смартфонов поспешили за новым трендом. Функцию распознавания лиц интегрировали в системы оплаты Apple Pay, Samsung Pay и Google Pay. Все просто: пользователю достаточно взглянуть на свой смартфон и подтвердить оплату, после чего поднести устройство к кассовому аппарату.
Некоторые компании разрабатывают другую систему «оплаты лицом», при которой смартфон можно не брать с собой в магазин. Российский стартап VisionLabs создал сервис SelfieToPay: делаешь селфи в специальном приложении, привязываешь к аккаунту банковскую карту и «предъявляешь» на кассе свое лицо. Правда, необходимых кассовых аппаратов с камерами для распознавания лиц в российских магазинах и кафе пока что единицы. Аналогичный сервис под названием Identity Check в 2016 году начала тестировать Mastercard, а Alibaba развивает систему Smile to Pay, в которой для оплаты надо улыбнуться в камеру.
Быстрый check-in
В 2019 году пассажирка авиакомпании JetBlue столкнулась с технологией распознавания лиц при посадке в самолет и написала возмущенный твит: «Вместо того чтобы отсканировать мой посадочный талон или проверить мой паспорт, меня просто попросили посмотреть в камеру, после чего пустили на борт. Что, посадочные талоны заменили распознаванием лиц без моего ведома? Я что, давала на это согласие?» В компании извинились за доставленные неудобства и объяснили, что при желании от этой процедуры можно отказаться, а фотографии пассажиров предоставляет министерство национальной безопасности США.
Скорость сервиса в очередной раз столкнулась со старой доброй защитой персональных данных. Как бы то ни было, технология уже активно внедряется — и согласие клиентов мало кого интересует: системы распознавания лиц уже используют в American Airlines, Delta и других авиакомпаниях, а также в некоторых отелях Китая, Сингапура и Вьетнама.
В транспорт без билета
В 2019 году в московском метро в пилотном режиме начала работать система оплаты проезда с помощью технологии распознавания лиц — для начала только в рамках фокус-группы и только на станции «Сухаревская». Пассажир должен скачать приложение, сделать селфи и привязать банковскую карту, а на станции — подойти к специальному турникету и посмотреть в камеру, после чего деньги автоматически спишутся с его счета, а турникет откроется. Почти вся инфраструктура для полноценного запуска уже есть: 1 сентября этого года в столичной подземке должна полноценно заработать система распознавания лиц для выявления тех, кто находится в розыске, а подключить к ней систему оплаты — дело техники. Аналогичные системы уже используют в метро китайских Шэньчжэня, Чжэнчжоу и Харбина.
Контроль доступа
Технологию распознавания лиц уже используют в офисах и на предприятиях, многие технологические стартапы (например, FaceKey, FaceFirst и уже упоминавшаяся российская NtechLab) предлагают компаниям внедрить такую систему безопасности. К примеру, в московском офисе Lamoda эта технология уже используется: сотрудники могут не носить с собой пропуск, камера на входе просто сканирует лица посетителей и определяет, кого можно впустить.
Российский стартап Verme объединил технологию распознавания лиц с системой контроля за рабочим временем сотрудников: камера на входе фиксирует, во сколько пришел и ушел каждый работник. Особенно это технологическое решение полюбилось розничным компаниям с их большим штатом и сложностями в составлении графиков сотрудников — систему Verme используют в магазинах «М.Видео», «Эльдорадо», «Эконика».
Немного об алгоритме
Простыми словами, технология распознавания лиц состоит из двух этапов — идентификация лица человека и сравнение получившейся модели с уже имеющимися в базе данных. В случае с работой на локальном устройстве, например Face ID (как у Apple) и аналогов у других производителей, при первой настройке смартфон создает и запоминает модель лица, затем при каждом использовании происходит верификация, причем система может учиться по мере изменения внешности человека (очки, борода и проч.). Apple позволяет также включить функцию «внимания» — алгоритм сработает, только если человек откроет глаза и будет смотреть на телефон.
Производители используют так называемые сиамские нейронные сети, они позволяют проводить все «обучение» и анализ прямо на устройстве; правда, для этого необходимы достаточно мощные мобильные процессоры, которые стали распространены только в последние пару лет. У Apple ID специальная камера направляет на лицо 30 тыс. инфракрасных точек, которые и формируют его модель. При запуске технологии в компании заявляли, что вероятность ошибки — одна на миллион, в двадцать раз меньше, чем у технологии распознавания отпечатка пальца. Последующие эксперименты показали, что система не всегда справляется с различением близнецов. Но, конечно, обмануть современные системы, показав камере просто фотографию человека из его соцсети, не получится. Чем выше будут вычислительные мощности устройств и чем большие базы данных обработают крупнейшие производители, тем эффективнее будет работать система. В технологиях уличного наблюдения фотографии уже сравниваются с записанными в удаленной базе данных.
В заключение заметим, что за развитыми алгоритмами распознавания следом бегут и технологии хакинга. Немало любителей пытались взломать Apple Face ID, печатая маски лица на 3D-принтерах. Почти все потерпели неудачу, но по меньшей мере одному вьетнамскому программисту это удалось. А генеративно-состязательные сети могут создавать вполне реальные образы нереальных людей уже сейчас. Достаточно зайти на сайт Thispersondoesnotexist.com. Посмотрите на фото этих людей — в реальности их не существует, и заполонить такими «несуществующими душами» любую базу тоже вполне реально.