Categories: Культура Основное

Национальный корпус якутского языка планируют запустить в работу в марте

В корпус уже введено около 15 млн словоупотреблений, этот объём планируют довести до 20 млн

Национальный корпус якутского языка – это информационно-справочная система, работа над которой ведётся с 2022 года. Он разработан Институтом гуманитарных исследований и проблем малочисленных народов Севера СО РАН. Предварительно его запуск запланирован на март, сообщает ЯСИА.

Руководитель проекта, ведущий научный сотрудник института, кандидат филологических наук Наталья Попова подчеркнула, что корпус станет важным инструментом для изучения и сохранения якутского языка.

«Мы изначально задумывали корпус для лингвистических исследований, но теперь видим его значимость для широкой аудитории. Он послужит фундаментальной основой как для всестороннего изучения, так и для сохранения и популяризации якутского языка», — отметила она.

Основу корпуса составляет собрание текстов на якутском языке в электронном формате. В него вошли не только литературные произведения, но и научные, образовательные, фольклорные, религиозные тексты, а также материалы из электронных и печатных СМИ, социальных сетей и интернет-форумов.

Скриншоты предоставлены Натальей Поповой

В корпус уже введено около 15 млн словоупотреблений, а в дальнейшем планируется довести этот объём до 20 млн. Работа ведется в сотрудничестве со специалистами Арктического государственного института культуры и искусств.

Национальный корпус якутского языка состоит из семи разделов:

  • корпус текстов (литературных/нелитературных);
  • морфологический анализатор;
  • грамматика в таблицах;
  • базы данных (топонимы, диалектизмы, фразеологизмы, архаизмы, термины, тематические группы имен и глаголов, личные имена и фамилии);
  • словари (терминологические, 15-томный Большой толковый словарь якутского языка);
  • раздел «О проекте»;
  • справочный раздел «Помощь».
Скриншоты предоставлены Натальей Поповой
Скриншоты предоставлены Натальей Поповой
Скриншоты предоставлены Натальей Поповой
Скриншоты предоставлены Натальей Поповой
Скриншоты предоставлены Натальей Поповой
Скриншоты предоставлены Натальей Поповой
Скриншоты предоставлены Натальей Поповой
Скриншоты предоставлены Натальей Поповой
Скриншоты предоставлены Натальей Поповой
Скриншоты предоставлены Натальей Поповой

Система предоставляет пользователям возможность автоматического анализа слов по принципу морфемного членения с лингвистическими пометами, выделения синонимических и омонимических рядов, поиска имён и глаголов по тематическим группам, а также различных грамматических конструкций.

Также доступен поиск диалектных слов, архаизмов, фразеологизмов по заданным тематическим группам, а топонимов — с демонстрацией мест их распространения на интерактивной карте. Корпус оснащён обширной операционной системой. Ответственным исполнителем проекта по разработке программного обеспечения проекта является младший научный сотрудник института Василий Бочкарёв, который занимается технической реализацией и разработкой алгоритмов поиска и анализа данных.

Скриншоты предоставлены Натальей Поповой
Скриншоты предоставлены Натальей Поповой

Проект реализован в рамках республиканской государственной программы сохранения государственных и официальных языков Якутии. Это важный шаг в цифровизации и систематизации якутского языка, обеспечивающий его доступность для будущих поколений.

Корпус предусматривает возможность переключения языков и будет доступен на русском и якутском языках, что позволит расширить аудиторию и сделать его полезным для международного сообщества.

Национальный корпус якутского языка становится ценным инструментом для лингвистов, студентов, преподавателей и всех, кто хочет глубже изучить якутский язык. В будущем планируется дальнейшее развитие платформы, пополнение её новыми текстами и улучшением функционала. Благодаря таким проектам якутский язык получает новую жизнь в цифровой среде, становясь доступным и удобным для изучения и использования.

Recent Posts

  • Общество

В Якутии именем писателя и геолога Василия Тумарча назвали алмаз

Алмаз весом 60,63 карата был найден 6 декабря 2024 года на трубке «Юбилейная»

27.05.2025
  • Культура

Театр эстрады Якутии представит в Москве этно-мюзикл «Багровое солнце»

Кроме того, мюзикл станет главной темой популярного шоу «Обсудим в антракте» от проекта Musical Universe

27.05.2025
  • Актуально

Аэропорт Среднеколымска готовится к первым рейсам после паводка

Планируется выполнение двух рейсов авиакомпании «Полярные авиалинии»

27.05.2025
  • Криминал

В Нерюнгри задержали 40-летнего мужчину по подозрению в убийстве

За остановкой общественного транспорта нашли тело женщины с колото-резаными ранениями

27.05.2025
  • Общество

Министр культуры Бурятии: «У Якутии есть чему поучиться»

В Якутске проходит форум креативных индустрий «Создано на Дальнем Востоке: от творчества к экономике»

27.05.2025
  • Общество

Общественная палата Якутии провела более 150 мероприятий за год

Организация подвела итоги года работы

27.05.2025