УДК 004.93
АВТОМАТИЗАЦИЯ ПРОЦЕССА РАСПОЗНАВАНИЯ ДОКУМЕНТОВ С ИСПОЛЬЗОВАНИЕМ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ
Вагнер Александр Валерьевич, магистрант, направление подготовки 09.04.04 Программная инженерия, Оренбургский государственный университет, Оренбург
e-mail: alexmednogorsk@mail.ru
Научный руководитель: Горбачев Дмитрий Владимирович, кандидат технических наук, доцент, доцент кафедры программного обеспечения вычислительной техники и автоматизированных систем, Оренбургский государственный университет, Оренбург
e-mail: gordi47@mail.ru
Аннотация. В данной статье рассматривается тема автоматизации процесса распознавания документов с использованием сверточных нейронных сетей. Это достаточно сложная задача, но ее актуальность заключается в том, что на данный момент обмен документами в основном происходит в электронном виде, вследствие чего возрастает объем документов и возникает потребность в более быстрой и тщательной проверке документов.
Целью данной работы является разработка сверточной нейронной сети, которая будет распознавать, какое фото было загружено: паспорт или другой документ. Имея на руках такую систему, уже можно автоматизировать небольшую часть работы с документами.
Представленная работа реализовывалась в несколько этапов:
1) анализ необходимой научной литературы;
2) проектирование и обучение сверточной нейронной сети на наборе, состоящем из 2000 изображений;
3) апробирование сверточной нейронной сети на тестовом наборе данных из 200 изображений.
В результате апробации было показано, что данная нейронная сеть способна распознавать изображение паспорта среди любых случайных изображений с точностью в 95%.
Спроектированная нейронная сеть имеет практическую значимость, так как такая нейронная сеть способна оптимизировать деятельность абсолютно любой организации. Достаточно лишь обучить нейросеть на том наборе данных, который используется на предприятии.
Кроме того, данная нейронная сеть может использоваться для распознавания не только изображений документов, но и любых других изображений, например, 3D-моделей, различных объектов и приборов, используемых на предприятии.
В дальнейшем планируется доработать модель сверточной нейронной сети, чтобы такая сеть могла распознавать текст внутри документа, например, срок действия документа, и определять — не просрочен ли документ.
Ключевые слова: автоматизация, сверточные нейронные сети, документы, обучение, распознавание, Python, TensorFlow, Keras, OpenCV.
Для цитирования: Вагнер А. В. Автоматизация процесса распознавания документов с использованием сверточных нейронных сетей // Шаг в науку. — 2021. — № 4. — С. 34–39.