Накануне важного праздника в регионе — Дня республики — в Яндекс.Переводчике появился якутский язык. Как сообщает ЯСИА со ссылкой на пресс-службу Яндекса, теперь все желающие могут переводить слова и фразы с якутского на 98 языков и обратно. Сервис доступен на сайте и в мобильном приложении.
Отмечается, что по данным переписи населения 2010 года, якутским языком владеют более 450 тысяч человек, проживающих в основном на территории Якутии. Теперь люди, которые говорят и пишут на якутском, могут использовать Переводчик для чтения текстов на иностранном языке.
«Как и для многих других языков народов России, для якутского языка существует очень мало параллельных текстов, необходимых для обучения машинного переводчика. В Якутии команде Яндекса помогли энтузиасты, которые собрали около 50 тысяч фраз на якутском и их переводы на русский», — сообщили в пресс-службе.
Переводчик разрабатывали в несколько этапов. Сперва команда сервиса обучила нейросеть на тех примерах, которые удалось собрать благодаря энтузиастам. Затем обогатила полученную модель данными из родственных языков. Якутский язык относится к тюркским языкам, поэтому для обогащения применили созданную ранее пантюркскую модель — она учитывает морфологию, лексику и синтаксис сразу нескольких таких языков. А чтобы нейросеть научилась составлять грамотные предложения на русском языке, использовали большие корпуса русских текстов и методику обратного перевода.
«Мало где в мире на территории одной страны можно встретить такое разнообразие языков, как в России. Это огромное богатство, и добавление языков разных народов в Яндекс.Переводчик — один из способов их сохранения. Мы рады, что благодаря технологиям и бесценной помощи энтузиастов, смогли добавить в наш Переводчик якутский язык», — рассказал заместитель руководителя отдела машинного перевода Яндекса Антон Дворкович.
Как отметил инициатор поддержки якутского языка в машинных переводчиках Алексей Иванов, идея создать машинный перевод для якутского языка возникла еще в 2017 году.
«Последние полтора года на общественных началах ведется сбор двуязычных русско-якутских текстов, подготовка эталонных якутско-русских переводов для оценки качества перевода. Качество машинного перевода для якутского языка уже приближается к человеческому, но ещё требует совершенствования. Совместно с командой Яндекс.Переводчика мы продолжим собирать данные для достижения ещё более высокого результата. Машинные переводчики — один из важных инструментов по сохранению исчезающих языков. По моему мнению, компания «Яндекс» является единственной компанией в мире, которая ведет работу по сохранению языков народов России с помощью машинного перевода», — сообщил научный сотрудник Национальной библиотеки Якутии.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: