Израильские эксперты создали искусственный интеллект для перевода древнего клинописного текста
Эксперты в области ассириологии, специализирующиеся на археологических, исторических, культурных и лингвистических исследованиях Ассирии и остальной части древней Месопотамии (Ирака), тратят много лет на кропотливые попытки понять аккадские тексты, написанные клинописью, одной из древнейших известных форм письма, пишет журналистка «The Jerusalem Post» Джуди Зигель-Ицкович.
Клинопись переводится как «клиновидная», потому что в древности ее писали с помощью тростникового стилуса, чтобы сделать клиновидную отметку на глиняной табличке. Но теперь исследователи из Тель-Авивского университета (ТАУ) и Университета Ариэля разработали модель искусственного интеллекта, которая минимизирует все эти усилия. Модель ИИ может автоматически переводить аккадский текст, написанный клинописью, на английский язык.
Археологи нашли сотни тысяч глиняных табличек из древней Месопотамии, написанных клинописью и датируемых начиная с 3400 года до н. Доктор Шай Гордин из Ариэльского университета и доктор Гай Гутерц, доктор Джонатан Берант и доктор Омер Леви из TAU и их коллеги только что опубликовали свои выводы в журнале «PNAS Nexus» под заголовком «Перевод аккадского языка на английский с помощью нейронного машинного перевода». Когда они разработали новую модель машинного обучения, они обучили две версии: одну, которая переводит аккадский язык из клинописных знаков в латиницу. И другую, которая переводит клинописные знаки в кодировку «Юникод». Первая версия, использующая латинскую транслитерацию, дала более удовлетворительные результаты в этом исследовании, набрав 37,47 балла в «Best Bilingual Evaluation Understudy 4» (BLEU4), который представляет собой проверку уровня соответствия между машинным и человеческим переводом одного и того же текста.
Программа наиболее эффективна при переводе предложений длиной до 118 символов. В некоторых предложениях программа создавала «галлюцинации» — перевод, который был синтаксически правильным на английском языке, но поверхностным. Гордин отметил, что в большинстве случаев перевод можно было бы использовать в качестве первого ознакомления с текстом. Авторы предлагают использовать машинный перевод как часть «сотрудничества человека и машины», при котором ученые-люди корректируют и уточняют результаты. Они писали, что сотни тысяч глиняных табличек, начертанных клинописью, документируют политическую, социальную, экономическую и научную историю древней Месопотамии. «Тем не менее, большинство этих документов остаются непереведенными и недоступными из-за их огромного количества и ограниченного количества экспертов, способных их прочитать».
Они пришли к выводу, что перевод — это фундаментальная человеческая деятельность, имеющая долгую научную историю с момента появления письменности. «Это может быть сложный процесс, поскольку он обычно требует не только экспертного знания двух разных языков, но и разной культурной среды. Онлайн-инструменты, которые могут помочь в переводе, с каждым годом становятся все более распространенными, что связано с достижениями в таких областях, как оптическое распознавание символов (OCR) и машинный перевод. Однако древние языки по-прежнему представляют собой серьезную проблему в этом отношении. Их чтение и понимание требуют знаний о давно исчезнувшем языковом сообществе, кроме того, сами тексты тоже могут быть очень фрагментарными».