Inventory number IRN Number of state registration
0223РК00400 BR18574183-OT-23 0123РК00991
Document type Terms of distribution Availability of implementation
Промежуточный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 9
International publications: 3 Publications Web of science: 0 Publications Scopus: 0
Number of books Appendicies Sources
1 2 50
Total number of pages Patents Illustrations
85 0 25
Amount of funding Code of the program Table
166999993 О.1117 11
Code of the program's task under which the job is done
01
Name of work
Автоматическое распознавание казахского текста разработка лингвистических модулей и IT-решений
Report title
Type of work Source of funding The product offerred for implementation
Applied research Материалы
Report authors
Фазылжанова Анар Муратовна , Базарбаева Зейнеп Муслимовна , Алдаш Айманкүл , Мамынова Бағдан Қатайқызы , Жанабекова Айман Абдильдаевна , Кулманов Сарсенбай Куантаевич , Пашан Дана Мұсабекқызы , Амиржанова Назира Сериковна , Солтанбекова Альфия Абдыкеновна , Хабиева Алмагуль Алтаевна , Рамазанов Талгат Бекбулатович , Садық Дидар Айдарұлы , Оспангазиева Назгуль Бакытовна , Кожахметова Актоты Кожахметкызы , Тлегенова Гульден Бакытказыевна , Мурсал Айкерим - , Омарова Аягуль Данияровна , Бесиров Еркин Бекжанович , Имангазина Меруерт Ануаровна , Слямбеков Қымбат Берікұлы , Ескендір Жарас Ертайұлы , Турсатаева Самал Саржанкызы ,
0
1
7
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Республиканское государственное предприятие на праве хозяйственного пользования "Институт языкознания имени А.Байтурсынова"
Abbreviated name of the service recipient РГП на ПХВ "ИЯ им. А.Байтурсынова" КН МОН РК
Abstract

Лингвистическое обеспечение автоматического распознавания казахского текста (далее - АРКТ) Учебный подкорпус Национального корпуса казахского языка как лингвистическая база АРКТ IT-разработки по АРКТ

Қазақ мәтінін автоматты тануды (бұдан әрі – ҚМАТ) тілтанымдық жасақтамасы ҚМАТ-тың лингвистикалық базасы ретіндегі Қазақ тілі ұлттық корпусының Оқу ішкорпусы ҚМАТ-қа арналған IT-әзірлемелер

Разработка интегрированных лингвистических модулей и современных IT-решений для автоматического распознавания казахского текста open-source характерных проектов

Қазақ мәтінін автоматты тануға арналған open-source сипатты жобалардың кіріктірілген лингвистикалық модульдері мен заманауи IT-шешімдерін әзірлеу

методы лингвистических исследований параллельно используются с методами IT-разработок. По первому блоку структурная, описательная, классификация и группировка единиц языка по формальным признакам, лингвостатистический анализ; а по второму блоку, Программирование, интеллектуальный агент или экспертная система, нейронное машинное обучение, эталонные образы, ближний контекст, решающие функции, линейные решающие функции, оптимизация (метод оптимизации), опорные векторы, обобщенные решающие функции и ядра, детекция объектов, трассировка объектов, распознавание изображений, сегментация изображений, используются методы и приемы оценки и обнаружения глубины, расстояния.

лингвистикалық зерттеулер және IT-әзірлемелер әдістері қатар қолданылады. Біріншісі бойынша құрылымдық, сипаттамалық, тіл бірліктерін формалды белгілеріне қарай таптастыру, топтастыру, лингвостатистикалық талдау; ал екінші бойынша бағдарламалау, интеллектуалды агент немесе сарапшылық жүйе, нейрон желілер арқылы мәшинелік оқыту, эталондық образдар, жақын мәнмәтін, шешуші функциялар, сызықтық шешуші функциялар, оңтайландыру (метод оптимизации), тірек векторлар, жалпыланған шешуші функциялар мен ядролар, нысандарды детекторлау, нысандар трекингі, бейнелерді тану, бейнелерді сегменттеу, таптастыру, арақашықтық тереңдігін бағалау әдіс-тәсілдері қолданылады.

- 4 статей в КОКНВО МНВО РК; - 3 статьи в зарубежных научных изданиях; - 4 статьи в в республиканских научных изданиях; - 4 научные и научно-популярные статьи, интервью в СМИ, на ТВ; - проведен 1 круглый стол; - организовано 4 лингвистических семинаров; - проведена 1 конференция; - опубликован 1 сборник.

- ҚР ҒЖБМ ҒЖССҚК ұсынған ғылыми журналдарда 4 мақала; - шетелдік ғылыми басылымдарда 3 мақала; - республикалық ғылыми басылымдарда 4 мақала; - БАҚ-та, ТВ-да 4 ғылыми және ғылыми-көпшілік мақалалар, сұхбаттар; - 1 дөңгелек үстел өткізілді; - 4 лингвистикалық семинар ұйымдастырылды; - 1 конференция өткізілді; - 1 жинақ жарияланды.

Такие разработки облегчают работу не только отдельного пользователя, но и целых офисов, повышают эффективность, экономят производственное время, улучшают управление, сокращают бумажную работу в несколько раз.

Мұндай әзірлемелер жеке пайдаланушының ғана емес, тұтас кеңселердің жұмысын жеңілдетеді, тиімділігін арттырады, өндірістік уақытты үнемдейді, басқаруды жақсартады, қағазбастылықты бірнеше есе азайтады.

Результаты исследования будут высокоэффективными, так как направлены на разработку конкретных IT-решений, IT-проектов, их языкового обеспечения, преобразующих физические формы текстовых источников информации в цифровые, они будут доступны в открытом доступе, что позволит пользователю изменять, редактировать текстовые процессоры, программы электронных таблиц, осуществлять поиск в казахских текстах с помощью простого редактора. Такие разработки облегчают работу не только отдельного пользователя, но и целых офисов, повышают эффективность, экономят производственное время, улучшают управление, сокращают бумажную работу в несколько раз.

Зерттеу нәтижелерінің тиімділігі жоғары болмақ, себебі мәтіндік ақпарат көздерінің физикалық нысандарын цифрлық құжатқа айналдыратын нақты IT-шешімдер, IT-жобаларды, олардың тілтанымдық жасақтамасын әзірлеуге бағытталған, олар ашық түрде қолжетімді болады, бұл пайдаланушыға мәтіндік процессорларды, электрондық кестелер бағдарламасын өзгертуге, редакциялауға, қарапайым редактор көмегімен қазақ мәтіндерінде іздеуді жүзеге асыруға мүмкіндік береді. Мұндай әзірлемелер жеке пайдаланушының ғана емес, тұтас кеңселердің жұмысын жеңілдетеді, тиімділігін арттырады, өндірістік уақытты үнемдейді, басқаруды жақсартады, қағазбастылықты бірнеше есе азайтады.

направлены на разработку конкретных IT-решений, IT-проектов, их языкового обеспечения, преобразующих физические формы текстовых источников информации в цифровые, они будут доступны в открытом доступе, что позволит пользователю изменять, редактировать текстовые процессоры, программы электронных таблиц, осуществлять поиск в казахских текстах с помощью простого редактора.

мәтіндік ақпарат көздерінің физикалық нысандарын цифрлық құжатқа айналдыратын нақты IT-шешімдер, IT-жобаларды, олардың тілтанымдық жасақтамасын әзірлеуге бағытталған, олар ашық түрде қолжетімді болады, бұл пайдаланушыға мәтіндік процессорларды, электрондық кестелер бағдарламасын өзгертуге, редакциялауға, қарапайым редактор көмегімен қазақ мәтіндерінде іздеуді жүзеге асыруға мүмкіндік береді.

UDC indices
8`81
International classifier codes
16.21.37;
Readiness of the development for implementation
Key words in Russian
фонетика; фонология; лексикология; фонема; грамматика;
Key words in Kazakh
фонетика; фонология; лексикология; фонема; грамматика;
Head of the organization Фазылжанова Анар Муратовна Кандидат филологических наук /
Head of work Фазылжанова Анар Муратовна Кандидат филологических наук / нет
Native executive in charge