Исследование: искусственный интеллект перенимает антисемитские стереотипы из человеческой культуры
Крупные языковые модели искусственного интеллекта воспроизводят укоренившиеся антисемитские стереотипы, даже если разработчики специально пытаются исключить подобные предубеждения из их работы.
К такому выводу пришли исследователи из Университета имени Бен-Гуриона и Тель-Авивского университета, чья работа опубликована в рецензируемом научном журнале “American Psychologist”.
Об этом сообщает “The Times of Israel”.
Авторы исследования изучали то, как современные системы искусственного интеллекта представляют евреев и какие культурные ассоциации сохраняются внутри языковых моделей.
Основным объектом исследования стала модель ChatGPT-4 Turbo, однако аналогичные результаты были получены и при работе с другими системами, включая DeepSeek и Mistral.
По словам исследователей, проблема заключается в том, что искусственный интеллект обучается на огромных массивах человеческих текстов — книгах, статьях, сайтах и других источниках.
Вместе с полезными знаниями модели усваивают и исторические предрассудки, существующие в обществе.
Чтобы выявить скрытые стереотипы, учёные использовали специальную методику, позволяющую обойти встроенные механизмы защиты от дискриминационных высказываний.
Сначала ChatGPT попросили создать сотни биографий вымышленных персонажей с еврейскими и нееврейскими именами.
После этого из текстов были удалены любые указания на национальность и религию.
Затем сами модели искусственного интеллекта, а также сотни участников исследования оценивали персонажей по различным характеристикам.
Результаты показали устойчивую закономерность.
Персонажи с еврейскими именами чаще описывались как более умные, успешные, уверенные в себе и компетентные.
Однако одновременно им приписывались более низкие показатели доброжелательности, открытости и способности вызывать симпатию.
Исследователи отмечают, что такая комбинация качеств практически полностью соответствует одному из наиболее распространённых антисемитских стереотипов, существующих в западной культуре на протяжении многих десятилетий.
Кроме того, еврейским персонажам чаще приписывались такие черты, как стремление к контролю, доминирование, привилегированность, одержимость достижением целей и склонность к манипулированию окружающими.
Для дополнительной проверки учёные попросили модели искусственного интеллекта сопоставить подобные наборы характеристик с известными литературными и кинематографическими персонажами.
ChatGPT называл таких героев, как Тирион Ланнистер из «Игры престолов», Уолтер Уайт из «Во все тяжкие» и Майкл Корлеоне из «Крёстного отца».
После этого исследователи попросили системы определить, с какими социальными группами чаще всего ассоциируются подобные характеристики.
Все протестированные модели указали на евреев.
Авторы исследования подчёркивают, что речь идёт не о прямой антисемитской пропаганде со стороны искусственного интеллекта.
Проблема заключается в том, что нейтральные или даже положительные характеристики, объединяясь вместе, могут воспроизводить старые предрассудки в более скрытой форме.
Особую тревогу вызывает тот факт, что языковые модели всё активнее используются в сферах, влияющих на реальные человеческие решения — при подборе персонала, выдаче кредитов, оценке кандидатов на обучение и других процессах.
По мнению исследователей, скрытые стереотипы способны оказывать влияние на такие решения даже тогда, когда пользователи не осознают их существования.
Авторы работы подчёркивают, что аналогичные формы предвзятости ранее выявлялись и в отношении других групп населения, включая женщин и афроамериканцев.
Однако исследование стало одним из первых крупных академических проектов, посвящённых именно воспроизведению антисемитских стереотипов в системах искусственного интеллекта.
Статья получила символическое название: «От мифа к модели: образ еврея в генеративном искусственном интеллекте».
