Технология, которую Facebook**** и Google не решились выпустить
Инженеры технологических гигантов много лет назад создали инструменты, которые могли бы назвать любое лицо, но на этот раз Силиконовая долина не захотела действовать быстро и что-то ломать.
**** и Google не решились выпустить">
Однажды днем в начале 2017 года в штаб-квартире Facebook**** в Менло-Парке, Калифорния, инженер по имени Томмер Лейванд сидел в конференц-зале со смартфоном, прикрепленным к полям его бейсбольной кепки. Резиновые ленты помогли закрепить ее на месте так, чтобы камера была обращена наружу. Абсурдный телефон-шляпа, особенно некрутая версия будущего, содержал секретный инструмент, известный только небольшой группе сотрудников. То, что она могла сделать, было замечательным.
Горстка мужчин в комнате смеялась и возбужденно перебрасывалась словами друг с другом, что запечатлено на видео, снятом в тот день, пока один из них не попросил тишины. В комнате воцарилась тишина; демонстрация шла полным ходом.
Мистер Лейванд повернулся к мужчине, сидевшему через стол от него. Объектив камеры смартфона — круглый, черный, немигающий — навис надо лбом мистера Лейванда, как глаз циклопа, когда он рассматривал лицо перед собой. Две секунды спустя женский голос-робот объявил: “Зак Ховард”.
“Это я”, - подтвердил мистер Говард, инженер-механик.
Сотрудник, который видел демонстрацию технологии, подумал, что это должна была быть шутка. Но когда телефон начал правильно называть имена, ему показалось это жутким, как что-то из фильма-антиутопии.
Телефон-шляпа, идентифицирующий личность, был бы находкой для людей с проблемами зрения или слепотой к лицу, но это было рискованно. Предыдущее внедрение Facebook**** технологии распознавания лиц, позволяющей людям отмечать друзей на фотографиях, вызвало возмущение защитников конфиденциальности и привело к коллективному иску в Иллинойсе в 2015 году, который в конечном итоге обошелся компании в 650 миллионов долларов.
С подобной технологией в голове мистера Лейванда Facebook**** мог бы помешать пользователям когда-либо забыть имя коллеги, напомнить на коктейльной вечеринке, что у знакомого есть дети, о которых можно спросить, или помочь найти кого-то на переполненной конференции. Однако шесть лет спустя компания, ныне известная как Meta**, так и не выпустила версию этого продукта, и г-н Лейванд ушел в Apple работать над очками дополненной реальности Vision Pro.
В последние годы стартапы Clearview AI и PimEyes раздвинули границы того, что общественность считала возможным, выпустив поисковые системы для поиска лиц в сочетании с миллионами фотографий из общедоступной сети (PimEyes) или даже миллиардами (Clearview). С помощью этих инструментов, доступных полиции в случае с Clearview AI и широкой общественности в случае с PimEyes, снимок человека может быть использован для поиска других онлайн-фотографий, на которых появляется это лицо, потенциально раскрывая имя, профили в социальных сетях или информацию, с которой человек никогда бы не захотел, чтобы на него публично ссылались, например, рискованные фотографии.
То, что сделали эти стартапы, не было технологическим прорывом; это был прорыв с точки зрения этики. Технологические гиганты разработали способность распознавать лица незнакомых людей годами ранее, но предпочли придержать технологию, решив, что самая экстремальная версия — нанесение имени на лицо незнакомца — слишком опасна, чтобы делать ее широко доступной.
Выбор редакторов
Эндрю Ллойд Уэббер, любимец авангарда?
‘Собаки из резервации" были шедевром на все времена
Что нужно знать о восстановлении Paxlovid
Теперь, когда табу нарушено, технология распознавания лиц может стать повсеместной. В настоящее время используемая полицией для раскрытия преступлений, авторитарными правительствами для наблюдения за своими гражданами и предприятиями, чтобы не подпускать своих врагов, вскоре она может стать инструментом в наших руках, приложением на нашем телефоне — или в очках дополненной реальности, — которое откроет мир без незнакомцев.
**** и Google не решились выпустить">
‘Мы решили остановиться’
Еще в 2011 году инженер Google рассказал, что работал над инструментом, позволяющим гуглить чье-либо лицо и отображать другие его фотографии в Интернете. Несколько месяцев спустя председатель Google Эрик Шмидт заявил в интервью на сцене, что Google “создала эту технологию, а мы ее не использовали”.
“Насколько я знаю, это единственная технология, созданная Google, и, посмотрев на нее, мы решили остановиться”, - сказал г-н Шмидт.
Намеренно или нет, технологические гиганты также помогли удержать технологию от широкого распространения, раскупив самые передовые стартапы, которые ее предлагали. В 2010 году Apple купила многообещающую шведскую компанию по распознаванию лиц Polar Rose. В 2011 году Google приобрела американскую компанию по распознаванию лиц PittPatt, популярную среди федеральных агентств. А в 2012 Facebook**** приобрела израильскую компанию Face.com. В каждом случае новые владельцы закрывали услуги приобретенных компаний для посторонних. Тяжеловесы Кремниевой долины были фактическими привратниками того, как и будут ли использоваться технологии.
Facebook****, Google и Apple внедрили технологию распознавания лиц в том, что они считали относительно щадящими способами: в качестве средства безопасности для разблокировки смартфона, более эффективного способа помечать известных друзей на фотографиях и организационного инструмента для классификации фотографий со смартфона по лицам людей на них.
Однако за последние несколько лет ворота были растоптаны более мелкими и агрессивными компаниями, такими как Clearview AI и PimEyes. Что позволило осуществить сдвиг, так это открытый исходный код технологии нейронных сетей, которая сейчас лежит в основе большинства программ для искусственного интеллекта.
Понимание пути развития технологии распознавания лиц поможет нам ориентироваться в том, что ждет нас с другими достижениями в области искусственного интеллекта, такими как инструменты генерации изображений и текста. Полномочия решать, что они могут, а чего не могут делать, все чаще будут принадлежать любому, кто хоть немного разбирается в технике и может не обращать внимания на то, что широкая публика считает приемлемым.
‘Стоящий на плечах гигантов’
Как мы дошли до того, что кто-то может заметить “горячего папашу” на тротуаре Манхэттена, а затем использовать PimEyes, чтобы попытаться выяснить, кто он и где работает? Короткий ответ - это сочетание бесплатного кода, размещенного в Интернете, огромного количества общедоступных фотографий, научных работ, объясняющих, как собрать все это воедино, и бесцеремонного отношения к законам, регулирующим конфиденциальность.
Сооснователь Clearview AI Хоан Тон-Та, который руководил технологическим развитием своей компании, не имел специального образования в области биометрии. До Clearview AI он создавал Facebook****-викторины, игры для iPhone и глупые приложения, такие как “Прическа Трампа”, чтобы человек на фотографии выглядел причесанным, как бывший президент.
В своем стремлении создать новаторское и более прибыльное приложение мистер Тон-То обратился к бесплатным онлайн-ресурсам, таким как OpenFace — “библиотека распознавания лиц”, созданная группой из Университета Карнеги-Меллон. Библиотека кода была доступна на GitHub с предупреждением: “Пожалуйста, используйте ответственно!”
“Мы не поддерживаем использование этого проекта в приложениях, которые нарушают конфиденциальность и безопасность”, - говорится в заявлении. “Мы используем это, чтобы помочь пользователям с когнитивными нарушениями ощутить и понять окружающий их мир”.
Это была благородная просьба, но совершенно невыполнимая.
Мистер Тон - Это позволило запустить код OpenFace, но он не был идеальным, поэтому он продолжал искать, блуждая по академической литературе и репозиториям кода, пробуя то одно, то другое, чтобы увидеть, что работает. Он был похож на человека, прогуливающегося по фруктовому саду, пробующего плоды десятилетий исследований, созревшие для сбора и восхитительно свободные.
“Я не смог бы этого сделать, даже если бы мне пришлось создавать ее с нуля”, - сказал он, назвав имена некоторых исследователей, обладающих передовым компьютерным зрением и искусственным интеллектом, включая Джеффри Хинтона, “крестного отца A.I.”. "Я стоял на плечах гигантов”.
Мистер Тон - Это все еще в разработке. Clearview разработала версию своего приложения, которое работает с очками дополненной реальности, более полной реализацией шлема для вызова лиц, который команда инженеров Facebook**** создала годами ранее.
Конец анонимности
**** и Google не решились выпустить">
Очки дополненной реальности стоимостью 999 долларов, изготовленные компанией Vuzix, подключают пользователя к базе данных Clearview, насчитывающей 30 миллиардов лиц. Приложение A.R. от Clearview, которое может идентифицировать человека на расстоянии до 10 футов, пока недоступно для общественности, но Военно-воздушные силы выделили средства для его возможного использования на военных базах.
Осенним днем мистер Тон-Та продемонстрировал мне очки в квартире своей пресс-секретаря в Верхнем Вест-Сайде Манхэттена, надел их и посмотрел в мою сторону.
“Оооо, 176 фотографий”, - сказал он. “Фестиваль идей в Аспене. Кашмирский холм”, - прочитал он подпись к изображению на одной из появившихся фотографий.
Затем он протянул очки мне. Я надел их. Хотя они выглядели неуклюжими, они были легкими и сидели естественно. Мистер Тон-Это сказал, что он пробовал другие очки дополненной реальности, но эти показали себя лучше всего. “У них скоро выйдет новая версия”, - сказал он. “И они будут выглядеть круче, более хипстерскими”.
Когда я посмотрел на мистера Тон-Та через очки, вокруг его лица появился зеленый круг. Я постучал сенсорной панелью по своему правому виску. На квадратном дисплее, который мог видеть только я на правой линзе очков, появилось сообщение: “Поиск...”
А затем квадрат заполнился его фотографиями с подписью под каждой. Я прокручивал их с помощью сенсорной панели. Я нажал, чтобы выбрать ту, которая гласила “Генеральный директор Clearview Хоан Тон-То”; там была ссылка, которая показала мне, что она взята с веб-сайта Clearview.
Я посмотрел на его пресс-секретаря, изучил ее лицо, и появилось 49 фотографий, в том числе одна с клиентом, о которой она попросила меня не упоминать. Это случайно показало, насколько навязчивым может быть поиск по чьему-либо лицу, даже для человека, чья работа заключается в том, чтобы заставить мир использовать эту технологию.
Я хотел вынести очки на улицу, чтобы посмотреть, как они работают на людях, которых я на самом деле не знал, но мистер Тон сказал, что мы не можем, потому что для очков требуется подключение по Wi-Fi, и потому что кто-то мог узнать его и сразу понять, что это за очки и что они могут сделать.
Меня это не пугало, хотя я знал, что так и должно быть. Было ясно, что люди, владеющие подобным инструментом, неизбежно будут иметь власть над теми, у кого ее нет. Но было определенное волнение от того, что она работала, как успешно выполненный волшебный трюк.
Упущенная возможность?
Meta** годами работала над собственными очками дополненной реальности. На внутреннем совещании в начале 2021 года технический директор компании Эндрю Босворт сказал, что хотел бы оснастить их возможностями распознавания лиц.
В записи внутреннего совещания мистер Босворт сказал, что исключение распознавания лиц из очков дополненной реальности было упущенной возможностью улучшить человеческую память. Он рассказал об универсальном опыте посещения званого ужина и встречи с кем-то, кого ты знаешь, но не можешь вспомнить его имя.
“Мы могли бы прикрепить к ним небольшую табличку с именем”, - сказал он в записи с коротким смешком. “Мы могли бы. У нас есть такая возможность”.
Но он выразил обеспокоенность по поводу законности предложения такого инструмента. Buzzfeed сообщила о его замечаниях в то время. В ответ мистер Босворт сказал, что распознавание лиц “чрезвычайно спорно” и что предоставление широкого доступа к ней - это “дискуссия, которую нам нужно провести с общественностью”.
Хотя очки дополненной реальности Meta** все еще находятся в разработке, компания отключила систему распознавания лиц Facebook****, которая позволяет отмечать друзей на фотографиях, и удалила более одного миллиарда отпечатков лиц, сделанных ее пользователями.
Было бы достаточно просто снова включить такую систему. Когда я спросил представителя Meta** о комментариях мистера Босворта и о том, может ли компания однажды внедрить распознавание лиц в свои очки дополненной реальности, он не исключил такой возможности.