Мансийский язык стал первым, размещённым на цифровой платформе
Журналисты газеты «Луима сэрипос» как истинные носители языка активно участвовали в реализации проекта по сохранению и цифровизации мансийского языка, выступив в роли экспертов и переводчиков.
Газета «Луима сэрипос» – периодическое издание, выходящее на мансийском языке, все статьи размещаются на сайте «Ханты Манси Мир» в свободном доступе. Для цифровизации мансийского языка, в первую очередь, были использованы статьи журналистов. Согласно статистике Цифрового корпуса, в систему было внесено около 45 тысяч пар предложений, взятых из мансийского издания.
Заместитель главного редактора газеты «Луима сэрипос» Галина Кондина рассказала:
– В проекте по созданию корпуса мансийского языка приняли участие все журналисты мансийской газеты. Ответственный секретарь нашего издания Светлана Ромбандеева и я выступили в качестве экспертов, проверяли переводы предложений, которые переводили носители языка. После проверки экспертов в систему было внесено 300 тысяч пар предложений на мансийском и русском языках.
Кроме этого, редактор Людмила Теткина и старший корреспондент Николай Меров выступили в качестве экспертов по проверке и корректировке машинного перевода. Редактор Тамара Мерова, корреспонденты Анна Алгадьева и Галина Дунаева стали переводчиками. Журналисты также выполняли разметку аудиопредложений, озвученных из архива газеты.
Необходимо отметить, что Галина Кондина занималась озвучкой мансийских предложений. Всего ею было озвучено 30 часов. Специалисты Югорского НИИ информационных технологий отмечают, что модель, обученная на этих записях, получила способность генерировать мансийскую речь голосом Галины Кондиной.
Галина Рудольфовна поблагодарила переводчиков и носителей мансийского языка, поскольку без их знаний такой масштабный проект не состоялся бы. Также она выразила признательность депутату окружной Думы Татьяне Гоголевой и депутату Тюменской областной Думы Надежде Алексеевой, которые внесли большой вклад в проект и стали его идейными вдохновителями, а также специалистам Югорского НИИ информационных технологий, реализовавшим проект.

Сегодня из языков народов Севера мансийский язык стал первым, размещенным на цифровой платформе. Теперь каждый желающий может воспользоваться онлайн-переводом через сайт сервиса или мобильное приложение «Яндекс. Переводчика».
Появление языка в сервисах перевода позволит расширить круг пользователей, упростит изучение языка, сделает его доступным широкой аудитории и укрепит национальную идентичность народа манси.

Работу по включению мансийского языка в «Яндекс. Переводчик» провели специалисты Югорского НИИ информационных технологий. Собранные данные были переданы в Яндекс, где они были использованы для обучения модели Переводчикa. Теперь в Цифровом корпусе более 300 тысяч пар предложений на мансийском и русском языках.
Напомним, что в Югре ведётся комплексная работа по цифровизации малоресурсных языков. Проект по созданию корпуса мансийского языка наглядно показывает, что в эпоху глобализации можно и нужно находить умные способы защиты языкового разнообразия, а включение мансийского языка в «Яндекс. Переводчик» является тому подтверждением.
Проект реализуется благодаря сотрудничеству с ФАДН России, Домом народов России, Обско-угорским институтом прикладных исследований и разработок, при поддержке Губернатора Югры, Депинформтехнологий Югры, Депобразования и науки Югры, Департамента молодежной политики, гражданских инициатив и внешних связей Югры и, конечно же, при участии носителей языка.
Людмила Теткина
фото из соцсетей Югорского НИИ информационных технологий


