Inventory number IRN Number of state registration
0220РК01236 AP05135175-OT-20 0118РК00284
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 3
International publications: 3 Publications Web of science: 0 Publications Scopus: 3
Number of books Appendicies Sources
1 5 57
Total number of pages Patents Illustrations
72 0 32
Amount of funding Code of the program Table
10000000 AP05135175 2
Code of the program's task under which the job is done
Г.2018 AP05135175
Name of work
Разработка и внедрение системы по распознанию рукописных адресов письменной корреспонденции АО «Казпочта» с использованием машинного обучения
Report title
Type of work Source of funding The product offerred for implementation
Applied Автоматизированная система
Report authors
Нурсеитов Данияр Борисович , Бостанбеков Кайрат Аратович , Абдурахманова Лаззат Тургунбаевна , Курманходжаев Данияр Болотбекович , Қанатов Мақсат Қанатұлы , Әбдіманап Ғалымжан Сейтахметғали , Tolegenov Rassul ,
0
1
2
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Некоммерческое акционерное общество "Казахский Национальный Исследовательский технический университет имени К.И. Сатпаева"
Abbreviated name of the service recipient НАО «КазНИТУ им. К.И. Сатпаева»
Abstract

Распознавание рукописного текста на адресном поле письменной корреспонденции

Хат корреспонденциясының мекен-жайы өрісінде қолжазба мәтінді тану.

Разработка программного обеспечения для распознавания рукописного текста на адресном поле письменной корреспонденции на русском и казахском языках с использованием моделей глубокого обучения.

Тереңдетілген оқыту модельдерін қолдана отырып, орыс және қазақ тілдеріндегі жазбаша хат-хабар алмасудың адрестік өрісінде қолжазбаны тануға арналған бағдарламалық жасақтама жасау

Для решения проблемы распознавания рукописного текста, применяются методы машинного обучения, такие как рекуррентные и сверточные нейронные сети.

Осы зерттеу аясында қолжазбаны тану мәселесін шешу үшін рекурентті және үйірткілі нейрондық желілер сияқты машиналық оқыту әдістері қолданылады.

Построена модель оптического распознавания рукописного текста, которая состоит из основных двух модулей: модуль сегментации слов и модуль распознавания слов. Для обучения модели распознавания был собран датасет русских и казахских слов, состоящий из 64 943 изображений с аннотациями, содержащие в себе 715 694 символов. Было разработано программное обеспечение для распознавания рукописного текста на адресном поле письменной корреспонденции на русском и казахском языках. Реализована модель оптического распознавания рукописного текста на основе сверточных и рекуррентных нейронных сетях. Результат впервые применен для офлайн распознавания рукописных почтовых адресов на кириллице.

Қолжазбаны оптикалық танудың соңғы моделі құрылды, ол екі негізгі модульден тұрады: сөзді бөлу модулі және сөзді тану модулі. Тану моделін үйрету үшін 715 694 таңбадан тұратын аннотациялары бар 64 943 суреттен құрылған орыс және қазақ сөздерінің жиынтығы жинақталды. Орыс және қазақ тілдеріндегі жазбаша хат-хабарлардың мекен-жайы бойынша мәтінді тануға арналған бағдарламалық қамтамасы құрылды. Рекурентті және үйірткілі нейрондық желілерге негізделген қолжазбалық мәтінді оптикалық тану моделі құрылды. Нәтиже алғаш рет кириллицада қолмен жазылған электрондық пошта мекенжайларын офлайн тану үшін қолданылды.

Автоматизированная работа центров обработки почтовых отправлений с увеличенным уровнем сервиса.

Поштаны өңдеу орталықтарының автоматтандырылған жұмысының қызмет көрсету деңгейін жоғарылату.

Экономический эффект заключается в сокращении издержек при сортировке письменной корреспонденции

Экономикалық тиімділігі пошта қызметтеріндегі жазбаша хат-хабарларды сұрыптау кезінде шығындарды азайту болып табылады.

Результаты проекта позволит автоматизировать обработку почтовой корреспонденции, включая рукописные адреса, максимально приближенной к бизнес-процессам почтовых служб.

Жоба нәтижелері пошта байланысының бизнес-процестеріне мүмкіндігінше жақын орналасқан пошта корреспонденцияларын, оның ішінде қолжазба мекен-жайларын автоматтандыруға мүмкіндік береді.

UDC indices
004.41, 004.931, 004.8
International classifier codes
20.15.13; 20.19.27; 20.19.29; 28.23.37;
Readiness of the development for implementation
Key words in Russian
OCR; HKR; оптическое распознавание; нейронные сети; рукописный текст; машинное обучение;
Key words in Kazakh
OCR; HKR; оптикалық тану; нейрондық желіліер; қолжазбалы мәтін; машиналық оқыту;
Head of the organization Сыздыков Аскар Хамзаевич Кандидат технических наук / доцент
Head of work Нурсеитов Данияр Борисович Кандидат физико-математических наук / Ассоциированный профессор (Доцент)
Native executive in charge