Новости

Инженер из «Гугла» создал проект по идентификации анонимных лиц с фотографий времен Второй мировой войны с помощью распознавания лиц искусственным интеллектом

27 июня, 15:00 Технологии
Поделиться

Проходя мимо бесчисленных фотографий выживших и жертв Холокоста в варшавском Музее истории польских евреев POLIN в 2016 году, уроженца Нью-Йорка Дэниела Патта преследовала мысль о том, что он проходит мимо лиц своих родственников, даже не подозревая об этом, пишет журналист «The Times of Israel» Яаков Шварц.

Для Патта, 40-летнего инженера – программиста, который сейчас работает в компании «Гугл», подобная головоломка открыла потенциал для творческого решения. И поэтому он приступил к созданию и разработке «От чисел к именам» (N2N), управляемой искусственным интеллектом платформы распознавания лиц, которая может сканировать фотографии из довоенной Европы и времен Холокоста, связывая их с людьми, живущими сегодня. Патт лично заинтересован в этом проекте: трое из его четырех бабушек и дедушек пережили Холокост, и он хочет помочь своей бабушке найти фотографии членов ее семьи, убитых нацистами.

Ей было всего 9 лет, когда началась война, и она бежала из родного города Замосць на восток с отцом, братьями и сестрами, а ее мать — прабабушка Патта — осталась. Ее мать была застрелена во время нацистского вторжения, а двоюродный дед Патта — брат его бабушки — впоследствии был убит, когда вернулся, чтобы спасти ее. Остальная часть семьи выжила и эмигрировала в Нью-Йорк после войны. В настоящее время программное обеспечение N2N — бесплатное и простое в использовании — выдает только 10 лучших потенциальных совпадений, которые оно может найти в доступной ему базе данных.

Хотя некоммерческий проект еще не совершенен, он уже добился большого успеха: программное обеспечение использовалось для поиска среди сотен тысяч фотографий, чтобы идентифицировать лица для Мемориального музея Холокоста в США (USHMM), а также ля отдельных выживших и потомков выживших, в том числе ряда знаменитостей. К Патту, который работал над проектом только в свободное время и за счет собственных ресурсов, теперь присоединилась команда инженеров, специалистов по данным и исследователей, которые постоянно расширяют возможности и точность программного обеспечения.

В дополнение к фотографиям и видеороликам, которые в настоящее время доступны на платформе, Патт работает с N2N, чтобы получить доступ к еще 700000 фотографий, сделанных до и во времена Холокоста. В интервью «The Times of Israel» по электронной почте 26 июня, в День переживших Холокост, Патт отметил, что стены музея POLIN заполнены фотографиями выживших и жертв, но мы знаем лишь горстку имен. Он заявил, что N2N может стать средством просвещения о Холокосте, давая учащимся возможность идентифицировать лица и артефакты в фото- и видеоархивах и потенциально обнаруживать новые связи между живыми потомками жертв Холокоста и их предками.

На данный момент команда проекта проанализировала почти полмиллиона фотографий, содержащих около 2 миллионов лиц, и у них накопилось множество потенциальных идентификаций, которые они сейчас просматривают вручную. Люди, заходящие на сайт, могут нажать «выбрать изображение». Затем они могут выбрать на своем компьютере или телефоне файл, содержащий обрезанную фотографию одного лица. Затем они могут нажать кнопку «Поиск», которая покажет им 10 фотографий, содержащих лица, наиболее похожие на предоставленное пользователем. Программное обеспечение лучше всего работает при поиске по фотографиям примерно одного периода времени (например, до 1960-х годов). Оно использует искусственный интеллект (ИИ), чтобы помочь потомкам жертв Холокоста находить изображения своих близких и идентифицировать миллионы неопознанных лиц в фото- и видеоархивах Холокоста.

Проект активно стремимся идентифицировать лица с помощью ИИ, а также предоставляет людям возможность проводить собственные исследования, в том числе через сайт numbertonames.org. Как отметил Патт, проект хотел бы сотрудничать с музеями, школами, научно-исследовательскими институтами и другими организациями, которые разделяют общие цели в области просвещения, повышения осведомленности о Холокосте и так далее. Что касается расширения базы данных, то в рамках проекта начали анализировать видеоролики из кино- и видеоархива Стивена Спилберга. Кроме того, также создается возможность для пользователей – исследователей предоставлять аннотации и идентификации непосредственно на платформе. Предполагается ввести возможность «офлайн-поиска», которая также позволит пользователям получать результаты поиска в течение дня, а не в течение нескольких секунд, что позволит снизить расходы.

КОММЕНТАРИИ
Поделиться

Выбор редакции