- Хантыйский
- Русский
Россия мўвев шуши мирӑт рәт ясӊӑт ванӆтӑты вєр
Щимӑщ нєм оӆӑӊмит вән мирхот тӑйс, мӑта ут Ас нопӑтты тыӆӑщ Москва хон вошн «Яндекс» хотн ӆэщӑтман вәс. Вантэ, 2022-2032-мит оӆӑт – щит мўвтєӆ шуши мирӑт рәт ясӊӑт ӆавӑӆты арт, щирн Россия мўвев арсыр мир вєрӑт тәты федеральной агентства (ФАДН) па «Россия мўвев мирӑт хот» нємпи тӑхеӊӑн ёх щимӑщ вән мирхот вєрсӑт. Тыв 50 тӑхи эвӑӆт 200-кєм рәт ясӑӊ еӆӆы Интернет хуща пунты вєрӑт тәты кәщайт, программистӑт, ӑӆ хуятӑт, айӆат ёх юхтыйӆсӑт.
«Ясӑӊ па цифра: иха рәпитты кәщайт, щурас ёх па ясӊӑт ӆавӑӆты ёх» пленарной мирхотн ФАДН тӑхи кәща ӆӑӊкӑр хә С. Бедкин вўща вєрман ястӑс:
- Россия мўвев кәщайт иса муй вєрӆӑт, ӆәӆн тӑм йисн рәт ясӊӑт Интернет хуща ат вәсӑт. Вантэ, ясӊӑт ӆєрамтты учёной ёх лупӆӑт, мӑтты ки тӑм йисн тәп Интернет мухты рәт ясӊӑт ӆавӑӆты рӑхӆ. Щирн кәщайта, щурас хуятӑта па ясӊӑт тӑйты ёха и ёшн, и ӛрн, и нумӑсн тӑм вән вєр тәты мосӆ.
Тӑм вән мирхот «Яндекс» тӑхи хотн мӑнӑс. Вантэ, ӆыв юхи хӑщум оӆӑтн Яндекс нейросеть хуща арсыр мосты вєрӑт вєрсӑт – щит «Яндекс Переводчик», щит путӑртты пийн имухты компьютерн хӑншты утӑт, щӑӆта Сбербанк ёх пиӆа арсыр ясӊӑтн «GigaChat» программа, щит «Паратайп» тӑхи ёх пиӆа 150 ясӑӊӑн компьютерн хӑншты пӑта нємасыя клавиатура па па м па мосты вєрӑт.
Интӑм Россия мўвев арсыр ясӊӑт Интернета пунты вєр хўват оӆӑӊмит тӑхийн вәӆ – щит арсыр ясӊӑтн мобильной приложенияйт, онлайн тулмащтӑты поступсэт па па вєра мосты вєрӑт тәӆыйт.
Ин «Яндекс Переводчик» хуща нивӆ ясӑӊ вәӆ, тӑм рәпата еӆӆы тәӆы. Еша вәӆ 22 ясӑӊ «Яндекс» нейросеть хуща пунӆы.
Вантэ, мўӊ няврємӆўв пӑта рәт ясӊӑт ӆавӑӆӆўв, щирн Интернет хуща арсыр вәнӆтӑты хӑрӑт ӆэщӑтты мосӆ. Ин 22 ясӑӊ щирн «Рувики» нємпи Интернет-энциклопедия рәпитӆ.
Югра мўв кәща ӆӑӊкӑр нє Е. Шумакова онлайн щирн ай тәс, муй щирн мўӊ округевн шуши мир ясӊӑт Интернет хуща пунӆыйт. Ӆўв тәса путӑртӑс, тәняӆ «Национальный корпус мансийского языка» ут вєрты оӆӊитсы. Щиты иха вухаӆь ясӑӊ ӆєрамтты, вәнӆтӑты, хӑншты ёх нємасыя ЮНИИ ИТ хуща вәнӆтыйӆсӑт, йис путрӑт, моньщӑт, арӑт Интернета пунты питсӑт, рўщ ясӑӊа тулмащтӑӆӑт, щитӑт ӆўӊӑтӆӑт. Тәняӆ оӆ вўш эвӑӆт Сўмӑтвош район ӑшколайтн вухаӆь ясӑӊ вәнӆтӑты няврємӑт «Онлайн-переводчик мансийского языка» щирн вәнӆтыйӆты оӆӊитсӑт. Ешавәӆ хӑнты ясӑӊ корпус вєрты оӆӊитӆы.
Еӆӆы вән мирхотн ӑкмум ёх ӆыв вєрӆаӆ оӆӑӊӑн ай тәсӑт. Щиты Казань вош эвӑӆт юхтум «Татарская гимназия №2» кәща хә Р. Гайнуллин ай тәс, ӆавӑрт коронавирус мәш вәӆум пура вўш эвӑӆт хӑтань ясӑӊ щирн онлайн-урокӑт нух хӑншты оӆӊитсыйт, интӑм рўщ ясӑӊ, литература, георгафия, физика па па предметӑт хўват 600 урок хӑншман вәӆ. Интӑм Интернет мухты кашӑӊ хуят вәнӆтыйӆты вєритӆ.
Уфа вош эвӑӆт программист хә А. Кунафин юхтыӆӑс, ӆўв тӑм ванӑн башкирской ясӑӊ щирн «Омай (Хомай)» нємпи нумсӑӊ хушап (колонка) вєрӑс:
- Ма нӆ няврєм тӑйӆум, айӆтыева ӆыв рәт ясӊӑӆ юрємӑты питсӑт, щирн нумса юхӑтсум рәт ясӊєм щирн нумсӑӊ колонка вєрты. Ин щимӑщ хушап арсыр ясӊӑтн вєрты нётӆум. Тӑм хушап унтасн кашӑӊ хуят башкирской ясӑӊ вәнӆтӑты вєритӆ. Ин щив башкир мир вәтаӊ ёх оӆӑӊӑн айкеӆӑт, йис путрӑт, моньщӑт, арӑт, стихӑт па па ищимӑщ утӑт пунӆўв.
Тӑм вән мирхотн арсыр тӑхет эвӑӆт юхтум мир путӑртсӑт, муй щирн ӆыв рәт ясӊеӆ Интернет хуща пунӆӑт. Программистӑт така лупсӑт:
- Мосӆ, ӆәӆн нын рәт ясӊӑнӑн Интернет хуща арсыр утӑт хӑншман ат вәсӑт, щит йис путрӑт, моньщӑт, ӑӆ путрӑт, арӑт, мультфильмӑт, кинайт, ратива па телевизионной передачайт, видеоурокӑт, энциклопедияйт, тулмащтум путрӑт па па утӑт. Вантэ, Интернет хуща арсыр утӑт вәӆӆӑт ки, ясӑӊ корпус кєншӑк вєрты питӆ.
Путӑр хӑншӑс:
Людмила Гурьева
Информационные технологии и языки народов России
Так называлась I стратегическая сессия, состоявшаяся 13-14 мая 2024 года в штаб-квартире ООО «Яндекс» в г. Москве. Мероприятие прошло в рамках Международного десятилетия языков коренных народов мира (2022 – 2032 гг.) и было организовано Федеральным агентством по делам национальностей России и Домом народов России. На сессию из 50 регионов России съехалось более 200 активистов и экспертов в области государственной языковой политики для того, чтобы представить практические наработки в области продвижения родных языков народов России в киберпространстве, тем самым обеспечивая полноценное функционирование языков в современном мире.
Открывая пленарное заседание «Язык и цифра: синергия государства, общества и бизнеса», заместитель руководителя Федерального агентства по делам национальностей Станислав Бедкин отметил:
– Правительством Российской Федерации большое внимание уделяется вопросу продвижения языков народов России в информационном пространстве. По мнению большинства экспертов, ведущих лингвистов, для успешного функционирования языков необходимо их представление в цифровом пространстве. Положительного результата мы сможем добиться, объединив усилия всех заинтересованных сторон – власти, бизнеса и общественности.
Если говорить об успешных проектах в этой области, то это мультиязычный инструмент, реализуемый компанией «Яндекс» на основе нейросети «YandexJPT» – это сервис машинного перевода «Яндекс Переводчик», технология распознавания и синтезирование речи «YandexSpeechKit», это проекты Сбербанка по созданию многоязычной цифровой модели «GigaСhat», способный генерировать текст на нескольких языках народов России, это виртуальный ассистент с искусственным интеллектом, это проекты компании «Паратайп», которые занимаются компьютерной раскладкой на основе расширенной кириллицы на всех 150 языках народов России и т.д.
Успех зависит не только от власти и бизнеса, но, в первую очередь, от языковых активистов, только благодаря их энтузиазму, личному душевному порыву они фактически дарят новую цифровую жизнь своим родным языкам.
На сегодня мы первые в мире по такой активной цифровизации языков народов России – а это создание шрифтов, компьютерной раскладки, разработка мобильных приложений, онлайн-переводчиков, программ по распознаванию речи, проверки орфографии и т.д. В прошлом году более чем в 30 регионах страны состоялись мероприятия, посвящённые цифровизации языков.
На сегодня восемь языков народов России имеются в «Яндекс Переводчике», эта работа активно продолжается на местах. Кроме того, ещё 22 языка находятся на стадии включения в нейросеть «Яндекс».
Говоря о цифровизации языков, важно упомянуть о другом важном направлении – использование цифровых возможностей в сфере изучения родных языков. Речь идёт о создании цифровой образовательной среды – приложений, программ, сервисов, которые позволяют повышать эффективность в изучении родных языков. Удачный проект – это «Интернет-энциклопедия «Рувики», который доступен на 22 языках народов России.
Сегодня на стратегической сессии необходимо добиться синергетического эффекта взаимодействия власти – бизнеса – языковых активистов. Кроме того, вы будете говорить о том, как, например, перевести одни и те же статьи для российской Интернет-энциклопедии «Рувики» на все родные языки народов нашей страны, это будет очень полезным для создания параллельных языковых корпусов и разработки машинного переводчика. Конечно, остро стоит вопрос о создании разнообразного контента на родных языках, поскольку молодёжь уже меньше говорит на своих родных языках, а наша с вами задача – пробудить в них интерес к изучению языков с помощью качественного образовательного контента.
Нам предстоит поработать над машинными переводчиками, чтобы преодолеть пользовательский языковой барьер, разработать удобный интерфейс на родных языках, создать Интернет-энциклопедии и т.д., а всё для того, чтобы языки народов нашей многонациональной России устойчиво развивались в реалиях современного времени.
Заместитель губернатора Югры Елена Шумакова в онлайн-режиме рассказала о работе по цифровизации родных языков коренных народов региона. Говоря об образовании, участникам сессии представила проект «Стойбищная школа – сад». Спикер более подробнее остановилась на проекте «Национальный корпус мансийского языка», который способствует сохранению мансийского языка с помощью современных цифровых технологий. С прошлого года ведётся работа по параллельному переводу предложений с русского на мансийский язык, осуществляется аудиозапись мансийской речи, оцифровка и перевод в машиночитаемый вид произведений мансийских авторов и периодических изданий на мансийском языке. В этой большой работе задействованы программисты Югорского НИИ информационных технологий (ЮНИИ ИТ) и языковые активисты. Кроме того, с прошлого года в школах Берёзовского района проходит апробацию «Онлайн-переводчика мансийского языка», сформирован словарь со звуковым сопровождением и иллюстрациями, это всё сделано также носителями языка. В скором будущем аналогичная работа начнётся и по созданию «Национального корпуса хантыйского языка» по всем диалектам.
Сегодня на площадке многие специалисты говорили о том, что очень важно, чтобы языки народов России как можно больше были представлены в Интернете, будь это видеоуроки, телерадиоэфиры, песни на родных языках, озвученные периодические издания – всё это способствует сохранению родных языков для современной молодёжи и будущего поколения. Участники делились своим опытом по оцифровке родных языков. Так, директор «Татарской гимназии №2» им. Шигабутдина Марджани из Казани Рамиль Гайнуллин рассказал о перспективе развития онлайн-школ на татарском языке. Эта работа началась в Республике Татарстан в период пандемии, сегодня это очень востребовано – записано более 600 видеоуроков на татарском языке по различным школьным предметам, это даёт возможность и для самостоятельного обучения и подготовки к экзаменам.
Программист из столицы Республики Башкирии – города Уфы – Айгиз Кунафин рассказал о том, как он разработал умную колонку на башкирском языке «Омай (Хомай)»: «У меня четверо детей, которые, к сожалению, уже плохо знают родной башкирский язык. Именно это меня подвигло создать «Умную колонку» на башкирском языке, но не только на одном языке, а также на русском и других языках народов России. «Умная колонка» на башкирском языке предназначена для людей разных возрастов, т.е. она может научить человека другой национальности с нуля башкирскому языку. «Умная колонка» на башкирском языке сделана по аналогии «Алисы» и «Маруси», но в то же время она усовершенствована. Сейчас мы наполняем колонку энциклопедическими сведениями о башкирских знаменитостях, художественными и музыкальными произведениями и т.д. Много ещё работы предстоит по совершенствованию «Умной колонки» на башкирском языке».
Кроме того, во время I стратегической сессии представители власти и бизнеса регионов обсуждали актуальные вопросы государственной политики в сфере поддержки языков народов России в киберпространстве.
Программисты говорили о том, чтобы как можно больше было исходных данных языков в киберпространстве: аудио, видео, мультфильмов, видеоуроков, текстов, Интернет-энциклопедий на родных языках, переводных статей с родных языков на русский и т.д., так как большое количество этого контента являются исходными данными для нейросетей.
В завершение мероприятия начальник Управления государственной политики в сфере межнациональных отношений Федерального агентства по делам национальностей России Тимур Цыбиков, подводя итоги, отметил, что в этом году шесть языков народов России (коми, тувинский, бурятский, мокшанский, эрзянский и чеченский) готовы для включения в нейросеть «Яндекс».
Людмила Гурьева