- Хантыйский
- Русский
Рәт ясӑӊ, вәӆупсы: йис пура вўш эвӑӆт тӑм пура вәнты
Хӑнты ясӑӊ
Хән хәӆӆум ма
хӑнты ясӑӊ,
Ищимет хәтӆумтӑӆ най…
Ӆоньщ кєша сот
нєм ӆўв тӑйӆ,
Сот щирн нӛхӑмӆа
йиӊкен…
(Роман Ругин)
Хӑнты мирев поэт Роман Ругин хӑншум щимӑщ ӆўӊтар тӑм вән научной мирхот «Программа» нєпек оӆӊитӑӆ. Щит ван хӑтӆуп тыӆӑщ 11-12-мит хӑтӆӊӑнӑн Ёмвошн «Музей геологии, нефти и газа» хотн вәс. Тӑм вән мирхот округ правительства, Ас-угорской научной институт па Югорской научно-исследовательской институт информационной технологияйт ёх унтасн ӆэщӑтсы. Россия мўвтєӆ мир научной мирхот «Год исторического наследия» оӆ па округев 95 оӆ постӑты пӑта вєрсы.
Мєт сыры округев 95 оӆ постӑты пӑта ай кина аӆьсы, муй щирн няврємӑт рәт ясӑӊа вәнӆтӑты мосӆ. Щит «Хӑтӆ» нємпи хӑнты-вухаӆь мирӊӑн театр ёх па «Ӆыӆӑӊ союм» няврємӑт юнтсӑт.
Округ кәща ӆӑӊкӑр нє Елена Майер вўща вєрӑс па лупӑс, ӆәӆн мирхот ма ат мӑнӑс. Щи пийн вухаӆь ясӑӊ корпус вєрум ёха ишӑкты нєпекӑт ёша мӑс.
Россия мўвев арсыр мир вєрӑт тәты федеральной агентства кәща хә Станислав Бедкин па арсыр ясӊӑт «Яндекс» хуща пунты вєр тәты хә Александр Болховитянов онлайн щирн вўща вєрсӑӊӑн.
Округ шуши мир вәӆупсы ӆавӑӆман тӑйты уполномоченной нє Людмила Алфёрова рәт ясӊӑт ӆавӑӆман тӑйты па еӆӆы тәты рәпатайт пӑта вәнӆтӑты вєрӑт ӆэщăтты департамент па Ас-угорской институт ёха вән пәмащипа лупӑс.
Тюменской областной дума депутат нє Надежда Алексеева вўща вєрман ишӑкты нєпекӑт па тынӑӊ мойӆупсэт информационной технологияйт Югорской научно-исследовательской институт, «Хӑнты ясӑӊ» па «Луима сэрипос» газетайӊӑн редакция па Ас-угорской институт ёха мойӆӑс.

Информационной технологияйт Югорской НИИ кәща хә А. Мельников «Национальный корпус мансийского языка» нємпи вєр оӆӑӊӑн ай тәс:
- 2017-мит оӆн ма нумăсн юхӑтсаюм, муй щирн математической модель иты муӆты ясӑӊ пунты. 2019-мит оӆн ЮНЕСКО научной мирхот пурайн ма щи оӆӑӊӑн лупсум. Щи пурайн щӑта ӑкмум мир веӆщи вухаӆь ясӑӊ корпус вєрты оӆӑӊӑн путӑртсӑт. Щиты айӆтыева ӆэщӑтты щи питсўв.
2023-мит оӆн «Корпус мансийского языка» вєрты щи оӆӊитсўв. Па мир ясӊӑт миллион ясӑӊ кӑр эвӑӆт корпус вєрты питсы. И нумса юхӑтсўв – вухаӆь ясӑӊ 300 щурӑс ясӑӊ кӑр эвӑӆт корпус вєрты. Мўӊ нємасыя портал вєрсўв, щӑта мєт вуӆаӊ – щит «Языковой центр», щӑта «Вухаӆь ясӑӊ корпус». Ин вухаӆь ясӑӊӑн 300 щурӑс ясӑӊ кӑр хӑншсўв.
«Переводчик мансийского языка» вєрсўв, щӑта рўщ ясӑӊ эвӑӆт вухаӆь ясӑӊа тулмащтӑты рӑхӆ па юхӆы. Мосӆ лупты, ипўӆяӊ вухаӆь ясӑӊӑн «Яндекс. Переводчик» тывӑс. Ешавәӆ иха кӑрӑтӆўв па и туӆмащтӑты ут питӆ.
Щи пурайн мўӊ «Словарь» вєрсўв. Мєт вуӆаӊ –мўӊ Аги эвие вєрсўв – щит нумсӑӊ сервис, щит рўщ «Алиса» хурпи. Аги эвие рўщ па вухаӆь ясӑӊӊӑнӑн путӑртты хошӆ, ӆўвеӆ арсыр вєрӑт оӆӑӊӑн иньщӑсты рӑхӆ, ӆўв мўӊ сайтэвн хӑншум айкеӆӑт оӆӑӊӑн вәятӆ, моньщӑт хӑншты па моньщты хошӆ. Щиты ӆовӑӆты вәнӆтыйӆты эви оӆӑӊӑн моньщ хӑншӑс.
Юхи хӑщум артӑн вухаӆь ясӑӊ корпус вєрты ёха вән пәмащипа лупӆум – ин вєккєши вухаӆь ясӑӊ ӆыӆӑӊа хӑщӆ.

«Вухаӆь ясӑӊ корпус» вән вєр тәты нє Н. Алексеева ай тәс, муй щирн тӑм вєр мӑнӑс:
- Интӑм Россия мўвевн 136 ясӑӊ ӆавӑӆты мосӆ. Тӑм оӆ «Стратегия национальной политики РФ» вән поступсы вўсы, щи әхтыйн Россия мўвев арсыр мирӑт йис вәӆупсы па ясӊӑт така ӆавӑӆты мосӆ. 2023-мит оӆн «Цифровой корпус мансийского языка» вєрты оӆӊитсўв. Щит пӑта мєт ар унтас ӑӆ вухаӆь мир тәс – мєт сыры вет хуят, щӑӆта 65 хуят рәпитсӑт. 15 щурӑс ясӑӊ кӑр вєрты оӆӊитсўв, ин рўщ па вухаӆь ясӑӊӊӑнӑн 300 щурӑс ясӑӊ кӑр тӑйӆўв. Ин цифровой словарь пӑта хурӑт вєрӆўв. Интернет хуща вухаӆь ясӑӊӑн хӑншум путрӑт вўсўв, мєт ар «Луима сэрипос» газета эвӑӆт.
Тӑм вән мирхот кӑт хӑтӆ мӑр арсыр секцияйт, ӊта пӑсан ӆэщӑтман вәсӑт.
Юхи хӑщум хӑтӆӑн уша вєрсӑт, муй щирн тӑм мирхот мӑнӑс.
Путӑр хӑншӑс:
Людмила Шульгина
«Язык, история и культура: от традиций к инновациям»
Язык ханты
Кладезь немеркнущих знаний:
В нём сохранились, точны,
Сотни для снега названий,
Сотни – для резвой волны.
Сотня имён и для ветра
В нём на сегодня живы…
Нет, не впустую так щедро
Он расточает слова!
Роман Ругин
С этого стихотворения известного хантыйского поэта Романа Ругина начинается программа Всероссийской научно-практической конференции «Язык, история и культура: от традиций к инновациям», которая состоялась 11-12 декабря 2025 года в Ханты-Мансийске в Музее геологии, нефти и газа. Организаторами мероприятия являются: Правительство автономного округа, Обско-угорский институт прикладных исследований и разработок и Югорский научно-исследовательский институт информационных технологий.
Конференция открылась видеороликом на мансийском языке, посвящённым 95-летию Югры. В сюжете было показано, как родные языки передаются от старшего поколения младшему с участием актёров театра обско-угорских народов «Солнце» и воспитанниками городского этнокультурно-образовательного центра.
Участников конференции поприветствовала и поздравила с 95-летием со дня образования Ханты-Мансийского автономного округа – Югры заместитель губернатора Югры Елена Майер, пожелала плодотворной работы конференции, а затем вручила активистам по работе с «Корпусом мансийского языка» почётные грамоты и благодарственные письма.
Также участников конференции поприветствовал заместитель руководителя Федерального агентства по делам национальностей Станислав Бедкин и руководитель проекта локализации продуктов «Яндекс» на языки народов России Александр Болховитянов.
Уполномоченный по правам коренных малочисленных народов Югры Людмила Алфёрова в своём приветствии отметила работу по сохранению и популяризации языка и культуры коренных народов округа окружного департамента образования и науки, а также Обско-угорского института прикладных исследований и разработок.

Депутат Тюменской областной думы Надежда Алексеева, поприветствовав участников конференции, вручила благодарности и ценные подарки сотрудникам Югорского научно-исследовательского института информационных технологий, редакции национальных газет «Ханты ясанг» и «Луима сэрипос», а также Обско-угорского института прикладных исследований и разработок.
Директор Югорского научно-исследовательского института информационных технологий Андрей Мельников презентовал проект «Национальный корпус мансийского языка». Затем он же открыл пленарное заседание «Ключевые аспекты функционирования языка и культуры в новой реальности XXI века» с докладом «Цифровая модель мансийского языка: от машинного перевода до генеративных вопросно-ответных систем»:
– Проект, о котором я сейчас хочу рассказать, зародился в 2017 году, тогда я задумался, а почему не использовать математические модели, чтобы сделать снимок языка? Эта идея была высказана мною в 2019 году на конференции на секции ЮНЕСКО, где говорили о сохранении языков. Там и прозвучала идея о создании модели мансийского языка, которой в хорошем смысле заразились люди. А затем, когда появились люди, болеющие за свой родной язык, то эта идея стала реализовываться в жизнь. Как-то выступал с докладом в школе №2, где дети задали непростой вопрос, а зачем сохранять малые языки? Я это вопрос озвучил и своим коллегам и получил массу ответов, но один поразил меня: «Язык нужно сохранить, потому что есть люди, которые хотят сохранить свой язык, говорить на нём, передавать подрастающему поколению».
В 2023 году, когда решились создавать «Корпус мансийского языка», то перед ним ставились непростые задачи в научном плане. Дело в том, что обучаемые модели требуют больших языковых корпусов. Речь идёт о миллионах записей речи. Близкие языки, такие как якутский, башкирский и татарский начинаются с миллиона предложений. При создании корпуса мансийского языка договорились о 300 тысячах моделей предложений. Мы создали специальный портал, где размещаются новости на русском и мансийском языках. Главное здесь – это «Языковый центр», где ключевым является «Корпус мансийского языка». На сегодня у нас уже более 300 тысяч пар предложений на двух языках: русском и мансийском.
Кроме этого, нами был сделан «Переводчик с мансийского языка» – это нейронная сеть, которая обучена на «Корпусе мансийского языка» и которая умеет переводить с русского на мансийский язык и обратно.
Слова и предложения озвучивает журналист мансийской газеты «Луима сэрипос» Галина Кондина. Наш «Переводчик» сделан параллельно с «Яндекс. Переводчиком», но по ряду параметров наш «Переводчик» лучше переводит. Мы сотрудничаем, по итогу будет работать одна модель.
Кроме «Переводчика» мы имеем «Словарь». При работе с составлением словаря столкнулись с проблемой, когда одно и тоже слово звучит по-разному.
Кроме всего этого, у нас есть самое главное – это девочка Аги – это интеллектуальный сервис, который умеет общаться на обоих языках, отвечать на вопросы, знает все новости сайта, умеет сочинять сказки. Например, она сочинила сказку на двух языках о девочке, которая училась грести.
Наш сайт развивается и совершенствуется. До конца года исправляем какие-то несовершенства в своей работе.
В завершение своего выступления хочу поблагодарить и низко поклониться большой команде за сплочённую работу для сохранения мансийского языка на века. Если бы не поддержка правительства, то такой огромный проект никогда не смог бы реализоваться.

Важно, что всё, что мы сделали, будет работать для людей, связанных с изучением или работой с мансийским языком.
Доктор филологических наук, доцент кафедры отделения теоретической и прикладной лингвистики филологического факультета Московского государственного университета им. М.В. Ломоносова Павел Гращенко поделился опытом работы по оцифровке нивхского языка.
На панельной сессии «Языки коренных народов Югры в эпоху цифровых трансформаций» куратор проекта «Корпус мансийского языка» Надежда Алексеева подробно рассказала об опыте работы участников проекта «Цифровой корпус мансийского языка», а также о том, с какими трудностями приходилось сталкиваться при работе:
– В России, где по оценкам экспертов насчитывается 136 исчезающих языков, ответом на вызовы стало принятие Стратегии государственной национальной политики Российской Федерации в ноябре 2025 года. Документ ставит целью укрепление единства многонационального народа при сохранении этнокультурного и языкового многообразия. Наш проект «Цифровой корпус мансийского языка» хорошо вписывается в эту Стратегию, он был инициирован в 2023 году Ассамблеей представителей коренных народов Думы Югры, Югорским научно-исследовательском институтом информационных технологий и Правительством округа в лице Департамента образования и науки и был направлен на создание цифровой базы данных корпуса параллельных текстов на русском и мансийском языках для разработки технологий машинного перевода и других сервисов. Ключевую роль в создании цифрового языкового ресурса сыграли рядовые носители мансийского языка как участники проекта. Проект начинался с пяти человек и возрос до 65 человек. Сначала взялись за 15 тысяч предложений, а потом уже к концу 2025 года достигли 300 тысяч переведённых пар предложений, кроме этого, уже много оцифрованных звуковых часов. Сейчас идёт работа над генерацией картинок для цифрового словаря. Работа велась со всеми текстами, представленными в цифровом пространстве, в первую очередь, с журналистскими текстами газеты «Луима сэрипос», а также с другими книжными публикациями на мансийском языке. В ходе работы мы провели опрос участников об отношении к работе в проекте. Все отметили важность этой работы для будущих поколений.
В течение двух дней работали площадки панельных сессий: «Историко-культурное наследие региона: образы, символы, смыслы», «Национальные коды в фольклоре и литературе», где обсуждались актуальные вопросы исследований языков и сохранения их для будущих поколений. Также работали круглые столы: «Междисциплинарные подходы в лингвистике и этнографии коренных народов», «Потенциал игры в процессе воспитания и обучения подрастающего поколения». Кроме этого, была предоставлена возможность пообщаться с экспертами из разных сфер деятельности.
На итоговой сессии был подведён итог работы конференции и намечен план на дальнейшую работу по сохранению и популяризации родных языков и культуры коренных малочисленных народов Югры.
Людмила Гурьева



