В корпус уже введено около 15 млн словоупотреблений, этот объём планируют довести до 20 млн
Фото: Мария Васильева/ЯСИА
Национальный корпус якутского языка – это информационно-справочная система, работа над которой ведётся с 2022 года. Он разработан Институтом гуманитарных исследований и проблем малочисленных народов Севера СО РАН. Предварительно его запуск запланирован на март, сообщает ЯСИА.
Руководитель проекта, ведущий научный сотрудник института, кандидат филологических наук Наталья Попова подчеркнула, что корпус станет важным инструментом для изучения и сохранения якутского языка.
«Мы изначально задумывали корпус для лингвистических исследований, но теперь видим его значимость для широкой аудитории. Он послужит фундаментальной основой как для всестороннего изучения, так и для сохранения и популяризации якутского языка», — отметила она.
Основу корпуса составляет собрание текстов на якутском языке в электронном формате. В него вошли не только литературные произведения, но и научные, образовательные, фольклорные, религиозные тексты, а также материалы из электронных и печатных СМИ, социальных сетей и интернет-форумов.
В корпус уже введено около 15 млн словоупотреблений, а в дальнейшем планируется довести этот объём до 20 млн. Работа ведется в сотрудничестве со специалистами Арктического государственного института культуры и искусств.
Национальный корпус якутского языка состоит из семи разделов:
Система предоставляет пользователям возможность автоматического анализа слов по принципу морфемного членения с лингвистическими пометами, выделения синонимических и омонимических рядов, поиска имён и глаголов по тематическим группам, а также различных грамматических конструкций.
Также доступен поиск диалектных слов, архаизмов, фразеологизмов по заданным тематическим группам, а топонимов — с демонстрацией мест их распространения на интерактивной карте. Корпус оснащён обширной операционной системой. Ответственным исполнителем проекта по разработке программного обеспечения проекта является младший научный сотрудник института Василий Бочкарёв, который занимается технической реализацией и разработкой алгоритмов поиска и анализа данных.
Проект реализован в рамках республиканской государственной программы сохранения государственных и официальных языков Якутии. Это важный шаг в цифровизации и систематизации якутского языка, обеспечивающий его доступность для будущих поколений.
Корпус предусматривает возможность переключения языков и будет доступен на русском и якутском языках, что позволит расширить аудиторию и сделать его полезным для международного сообщества.
Национальный корпус якутского языка становится ценным инструментом для лингвистов, студентов, преподавателей и всех, кто хочет глубже изучить якутский язык. В будущем планируется дальнейшее развитие платформы, пополнение её новыми текстами и улучшением функционала. Благодаря таким проектам якутский язык получает новую жизнь в цифровой среде, становясь доступным и удобным для изучения и использования.
В этом году для посетителей подготовлены несколько значительных новшеств
Андрей Костин считает, что к концу года ставка ЦБ может снизиться до 19%
Впервые в Якутии сформировано новое военное подразделение
В чемпионате приняли участие девять команд из шести школ улуса
Наиболее активные заемщики — это горожане в возрасте от 35 до 45 лет