В Якутии в тестовом режиме проверяют работу нейросети по документообороту

12:52, 22 октября
Текст:

В сентябре 2021 года в госорганах Якутии тестово заработала система классификации документов в Единой системе электронного документооборота (ЕСЭД) на основе нейронных сетей. Проект курируют министерство инноваций, цифрового развития и инфокоммуникационных технологий РС (Я) совместно с Республиканским центром инфокоммуникационных технологий (РЦИТ), сообщает ЯСИА пресс-служба Мининноваций.

ЕСЭД работает в Якутии с января 2019 года, сейчас в неё включены 37 органов государственной власти республики, 445 органов местного самоуправления, все госучреждения и большая часть муниципальных учреждений.

Каждый день в системе создается 3600 документов, 1700 РКПД и 9500 поручений. Объем базы данных составляет 5,2 Тб и растет на 1,9 Тб в год.

Итоги первого месяца обучения нейросети были представлены в Москве, на Всероссийской конференции «Осенний документооборот – 2021».

Петр Николаев, заместитель министра инноваций, цифрового развития и инфокоммуникационных технологий РС (Я):

Выбирая бизнес-процесс для внедрения нейросетей, мы остановились на распределении входящих документов по исполнителям. С одной стороны, обработка входящей корреспонденции – это рутинная, однообразная работа, но в то же время, определение сути вопроса в документе, и кто его решает, требует определённых знаний от специалиста и времени на изучение документа.

Кроме того, входящие документы – это неструктурированная информация, тексты в документах совершенно различного содержания, поэтому стандартные алгоритмы либо бессильны, либо должны быть чрезмерно сложны, в решении задачи распределения документов. Распределение документов по отделам – с точки зрения нейронной сети – задача классификации.

В нашем случае нейронная сеть должна классифицировать входящие документы по отделам, ускоряя прохождение документов до конечного исполнителя.

Для обучения моделей нейросети разработчики использовали входящие документы министерства инноваций РС(Я) и документы РЦИТ, начиная с января 2019 года. В общем получилось почти 20 000 документов с PDF-файлами.

После обучения для оценки работы нейросети в РЦИТ было собрано 550 проектов поручений за сентябрь и начало октября для сравнения исполнителей, выбранных нейросетью и человеком.

В 71% случаев нейросеть смогла дать ответ, к какому отделу относится документ. Из них 58% ответов полностью совпадали с выбором человека, и еще 22% частично совпадали. 20% процентов ответов не совпадали.

Средняя точность ответов составила 76%, а полнота – 68%. Это, как полагают разработчики, связано с неравномерным распределением объема документов по отделам.

В министерстве инноваций проанализировали результаты по 219 проектам поручений за период с 11 по 20 октября. Нейросеть выбрала исполнителей в 84% случаев.

58% ответов полностью совпадали с выбором человека, и еще 28% частично совпадали. 14% процентов ответов не совпадали. Средняя точность и полнота для министерства не рассчитана.

Петр Николаев:

Внедрение нейросети – процесс не быстрый, но уже мы видим неплохие результаты. Работа будет продолжаться в нескольких направлениях, в том числе на увеличение точности и полноты классификации, учёт реорганизаций в обучении нейросети.

0
0
4 декабря 04.12
  • -42°
  • $ 73,74
  • 83,24