Inventory number IRN Number of state registration
0224РК00687 BR18574183-OT-24 0123РК00991
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 10
International publications: 3 Publications Web of science: 0 Publications Scopus: 3
Number of books Appendicies Sources
1 2 9
Total number of pages Patents Illustrations
71 0 20
Amount of funding Code of the program Table
125000000 О.1117 2
Code of the program's task under which the job is done
01
Name of work
Автоматическое распознавание казахского текста разработка лингвистических модулей и IT-решений
Report title
Type of work Source of funding The product offerred for implementation
Applied research Другая (укажите)
Report authors
Фазылжанова Анар Муратовна , Базарбаева Зейнеп Муслимовна , Оспангазиева Назгуль Бакытовна , Жанабекова Айман Абдильдаевна , Тлегенова Гульден Бакытказыевна , Бесиров Еркин Бекжанович , Кожахметова Актоты Кожахметкызы , Барменкулова Аида Серикхановна , Амирбекова Айгул Байдебековна , Хабиева Алмагуль Алтаевна , Уәли Нұргелді , Алдаш Айманкүл , Тургинбаева Жазира Досымбековна , Турсатаева Самал Саржанкызы , Ескендір Жарас Ертайұлы , Пашан Дана Мұсабекқызы , Садық Дидар Айдарұлы , Жұманқызы Алтын , Солтанбекова Альфия Абдыкеновна , Мамынова Бағдан Қатайқызы , Рамазанов Талгат Бекбулатович , Имангазина Меруерт Ануаровна , Слямбеков Қымбат Берікұлы , Мурсал Айкерим - , Сейілхан Сымбат Абдусаламқызы , Кулманов Сарсенбай Куантаевич , Омарова Аягуль Данияровна , Жорабай Темірлан Сейтқасымұлы , Кудеринова Куралай Бимолдиновна ,
0
2
5
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Республиканское государственное предприятие на праве хозяйственного пользования "Институт языкознания имени А.Байтурсынова"
Abbreviated name of the service recipient РГП на ПХВ "ИЯ им. А.Байтурсынова" КН МОН РК
Abstract

Лингвистическое обеспечение автоматического распознавания казахского (печатного) текста (далее – АРКТ), Учебный подкорпус Национального корпуса казахского языка как лингвистическая база АРКТ, IT-разработки по АРКТ

Қазақ (баспа) мәтінін автоматты танудың (бұдан әрі – ҚМАТ) тілтанымдық жасақтамасы, ҚМАТ-тың лингвистикалық базасы ретіндегі Қазақ тілі ұлттық корпусының Оқу ішкорпусы, ҚМАТ-қа арналған IT-әзірлемелер.

Разработка интегрированных лингвистических модулей и современных IT-решений для автоматического распознавания казахского текста open-source характерных проектов

Қазақ мәтінін автоматты тануға арналған open-source сипатты жобалардың кіріктірілген лингвистикалық модульдері мен заманауи IT-шешімдерін әзірлеу

В исследовательской работе методы лингвистических исследований параллельно используются с методами IT-разработок. По первому блоку структурная, описательная, классификация и группировка единиц языка по формальным признакам, лингвостатистический анализ; а по второму блоку, Программирование, интеллектуальный агент или экспертная система, нейронное машинное обучение, эталонные образы, ближний контекст, решающие функции, линейные решающие функции, оптимизация (метод оптимизации), опорные векторы, обобщенные решающие функции и ядра, детекция объектов, трассировка объектов, распознавание изображений, сегментация изображений, используются методы и приемы оценки и обнаружения глубины, расстояния.

Зерттеу жұмысында лингвистикалық зерттеулер және IT-әзірлемелер әдістері қатар қолданылады. Біріншісі бойынша құрылымдық, сипаттамалық, тіл бірліктерін формалды белгілеріне қарай таптастыру, топтастыру, лингвостатистикалық талдау; ал екінші бойынша бағдарламалау, интеллектуалды агент немесе сарапшылық жүйе, нейрон желілер арқылы мәшинелік оқыту, эталондық образдар, жақын мәнмәтін, шешуші функциялар, сызықтық шешуші функциялар, оңтайландыру (метод оптимизации), тірек векторлар, жалпыланған шешуші функциялар мен ядролар, нысандарды детекторлау, нысандар трекингі, бейнелерді тану, бейнелерді сегменттеу, таптастыру, арақашықтық тереңдігін бағалау әдіс-тәсілдері қолданылады.

По результатам исследования получены научные результаты: - 3 статьи в научных журналах, рекомендованных КОКСНВО МНВО РК; - 3 статьи в зарубежных научных изданиях; - 3 статьи в республиканских научных изданиях; - 1 статья в международном научном издании; - 3 научных и научно-популярных статьи, интервью в СМИ; - проведено 2 круглых стола, 2 научно-производственных семинара; - 1 монография; - 1 инструкция; - разработана 1 программа оптического распознавания символов; - разработаны 1 веб-словарь и 1 синонимайзер; - разработан 1 ридер-конвертер.

Зерттеу жұмысы бойынша төмендегідей нәтижелер алынды: - ҚР ҒЖБМ ҒЖССҚК ұсынған ғылыми журналдарда 3 мақала; - шетелдік ғылыми басылымдарда 3 мақала; - республикалық ғылыми басылымдарда 3 мақала; - халықаралық ғылыми басылымда 1 мақала; - БАҚ-та 3 ғылыми және ғылыми-көпшілік мақалалар, сұхбаттар; - 2 дөңгелек үстел, 2 ғылыми-өндірістік семинар ұйымдастырылды; - 1 монография; - 1 нұсқаулық; - 1 таңбаларды оптикалық тану бағдарламасы жасалды; - 1 веб-сөздік және 1 синонимайзер әзірленді; - 1 ридер-конвертер әзірленді.

Такие разработки облегчают работу не только отдельного пользователя, но и целых офисов, повышают эффективность, экономят производственное время, улучшают управление, сокращают бумажную работу в несколько раз.

Мұндай әзірлемелер жеке пайдаланушының ғана емес, тұтас кеңселердің жұмысын жеңілдетеді, тиімділігін арттырады, өндірістік уақытты үнемдейді, басқаруды жақсартады, қағазбастылықты бірнеше есе азайтады.

Не предусмотрено

Қарастырылмаған

Результаты исследования будут высокоэффективными, так как направлены на разработку конкретных IT-решений, IT-проектов, их языкового обеспечения, преобразующих физические формы текстовых источников информации в цифровые, они будут доступны в открытом доступе, что позволит пользователю изменять, редактировать текстовые процессоры, программы электронных таблиц, осуществлять поиск в казахских текстах с помощью простого редактора. Такие разработки облегчают работу не только отдельного пользователя, но и целых офисов, повышают эффективность, экономят производственное время, улучшают управление, сокращают бумажную работу в несколько раз.

Зерттеу нәтижелерінің тиімділігі жоғары болмақ, себебі мәтіндік ақпарат көздерінің физикалық нысандарын цифрлық құжатқа айналдыратын нақты IT-шешімдер, IT-жобаларды, олардың тілтанымдық жасақтамасын әзірлеуге бағытталған, олар ашық түрде қолжетімді болады, бұл пайдаланушыға мәтіндік процессорларды, электрондық кестелер бағдарламасын өзгертуге, редакциялауға, қарапайым редактор көмегімен қазақ мәтіндерінде іздеуді жүзеге асыруға мүмкіндік береді. Мұндай әзірлемелер жеке пайдаланушының ғана емес, тұтас кеңселердің жұмысын жеңілдетеді, тиімділігін арттырады, өндірістік уақытты үнемдейді, басқаруды жақсартады, қағазбастылықты бірнеше есе азайтады.

Конкретные IT-решения, преобразующие физические формы текстовых источников информации в цифровые документы, направлены на разработку IT-проектов и их языкового обеспечения. Они будут доступны в открытом доступе, что позволит пользователю изменять, редактировать текстовые процессоры, программу электронных таблиц, осуществлять поиск в казахских текстах с помощью простого редактора.

Мәтіндік ақпарат көздерінің физикалық нысандарын цифрлық құжатқа айналдыратын нақты IT-шешімдер IT-жобалар мен олардың тілтанымдық жасақтамасын әзірлеуге бағытталған. Олар ашық түрде қолжетімді болады, бұл пайдаланушыға мәтіндік процессорларды, электрондық кестелер бағдарламасын өзгертуге, редакциялауға, қарапайым редактор көмегімен қазақ мәтіндерінде іздеуді жүзеге асыруға мүмкіндік береді.

UDC indices
8`81
International classifier codes
16.21.37;
Readiness of the development for implementation
Key words in Russian
ҚАЗАҚ МӘТІНІН АВТОМАТТЫ ТАНУ; ЛИНГВИСТИКАЛЫҚ МОДУЛЬДЕР; ТАҢБАЛАРДЫ ОПТИКАЛЫҚ ТАНУ; РИДЕР-КОНВЕРТЕР; ВЕБ-СӨЗДІК;
Key words in Kazakh
АВТОМАТИЧЕСКОЕ РАСПОЗНАВАНИЕ КАЗАХСКОГО ТЕКСТА; ЛИНГВИСТИЧЕСКИЕ МОДУЛИ; ОПТИЧЕСКОЕ РАСПОЗНАВАНИЕ СИМВОЛОВ; РИДЕР-КОНВЕРТЕР; ВЕБ-СЛОВАРЬ;
Head of the organization Фазылжанова Анар Муратовна Кандидат филологических наук /
Head of work Фазылжанова Анар Муратовна Кандидат филологических наук / нет
Native executive in charge