Inventory number IRN Number of state registration
0223РК00220 BR11765535-OT-23 0122РК00013
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 2
International publications: 4 Publications Web of science: 1 Publications Scopus: 3
Number of books Appendicies Sources
1 5 77
Total number of pages Patents Illustrations
181 0 106
Amount of funding Code of the program Table
104514973.53 О.1052 3
Code of the program's task under which the job is done
01
Name of work
Разработка научно-лингвистических основ и IT-ресурсов по расширению функций и повышению культуры казахского языка
Report title
Type of work Source of funding The product offerred for implementation
Applied Технология,Метод, способ,Модель,Базы, банки данных
Report authors
Бекманова Гульмира Тылеубердиевна , Шәріпбай Алтынбек Әмірұлы , Сыздыкова Гульбаршин , Онгарбаев Еркин Ануарович , Есенбаев Жандос Аманбаевич , Омарбекова Асель Сайлаубековна , Разахова Бибигул Шамшановна , Ергеш Бану Жантуғанқызы , Жеткенбай Лена , Кожирбаев Жанибек Мамбеткаримович , Жумагулова Айша Алгабековна , Аскарова Сандугаш , Зулхажав Алтанбек , Елибаева Газиза Казбековна , Кабдылова Динара Долелкановна , Тилеухан Айбол , Амангелді Нұрзада , Сайранбекова Аяулым Данияровна , Орынбай Лаура Орынбайқызы ,
5
0
2
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Некоммерческое акционерное общество "Евразийский Национальный университет имени Л.Н. Гумилева"
Abbreviated name of the service recipient НАО "ЕНУ им.Л.Н.Гумилева"
Abstract

Объектом исследования является казахский язык (текст, речь).

Зерттеу нысаны қазақ тілі (мәтін, сөйлеу) болып табылады.

Цель работы - разработка научно-лингвистических основ и IT-ресурсов по расширению функций и повышению культуры казахского языка, как языка межэтнического общения в цифровом формате.

Жұмыстың мақсаты- цифрлық форматта этносаралық қарым-қатынас тілі ретінде қазақ тілінің функциялары мен мәдениетін арттыру үшін ғылыми-лингвистикалық негіздер мен IT-ресурстарды әзірлеу.

Основной идеей данной программы является решение поставленных задач с помощью методов лингвистики и искусственного интеллекта через формализованное и семантическое описание казахского языка, построение предикативных баз знаний и программной реализации полученных моделей и методов.

Бұл программаның негізгі идеясы қазақ тілінің формальды және семантикалық сипаттамасы арқылы лингвистика мен жасанды интеллект әдістерін қолдана отырып қойылған міндеттерді шешу, алынған модельдер мен әдістердің предикативті білім базаларын құру және программалық іске асыру болып табылады.

- Разработано интеллектуальное приложение – синонимайзер стандартных образцов синонимического ряда слов в текстах общественно-политического дискурса и публичной речи. -Разработан грамматический электронный справочник грамматики современного казахского языка, состоящий из формального описания грамматики казахского языка. -Разработано мобильное приложение «Увлекательная ономастика». -Разработан электронный словарь терминологии школьных учебников. -Разработана интегральная модель (end-to-end) для синтеза казахской речи, состоящая математических моделей основе скрытых марковских моделей (НММ) - смеси гауссовских распределений (GMM) и интегральных систем (end-to-end) -Разработана информационная система для синтеза речи казахского языка. -Разработана интеллектуальная система «Ахметтану», состоящая из базы данных по научному наследию Ахмета Байтурсынулы и новые системы знаний по всем структурным ярусам языка в свете его учений, онтологические модели по всем структурным ярусам языка по наследию Ахмета Байтурсынулы.

- Қоғамдық-саяси дискурс пен көпшілік алдында сөйлеу мәтіндерінің синонимдік қатарының стандартты үлгілері бар синонимайзер интеллектуалды қосымшасы әзірленді. -Қазақ тілінің грамматикасын формалды сипаттаудан тұратын қазіргі қазақ тілі грамматикасының грамматикалық электронды анықтамалығы әзірленді. - «Қызықты ономастика» мобильді қосымшасы. -Мектеп оқулықтары терминологиясының электронды сөздігі. -Гаус үлестірімдері (GMM) мен интегралды жүйе (end-to-end) қоспасынан құралған жасырын Марк моделі негізіндегі математикалық модельден қазақша сөйлеу синтезіне арналған интегралды модель (end-to-end). -Қазақ тілінің сөйлеу синтезіне арналған ақпараттық жүйе әзірленді. -Ахмет Байтұрсынұлының ғылыми мұрасы деректер базасынан және оның оқулары бойынша барлық құрылымдық қабаттары бар жаңа білім жүйесінен, сонымен қатар оның оқулары бойынша тілдің барлық құрылымдық қабаттары бойынша білімнің онтологиялық моделінен тұратын «Ахметтану» интеллектуалды жүйесі әзірленді.

500 страниц текстов политического дискурса, структура базы знаний и 1000 записей базы знаний для синонимайзера, структура базы знаний (более 100 семантических признака) и 700 записей базы знаний для приложения "Увлекательная ономастика", структура базы знаний и 1000 записей базы знаний по топономике, аудиокорпус для синтезатора речи 50 часов.

Синонимайзерге арналған 500 бет саяси дискурс мәтіндері, білім базасының құрылымы және 1000 білім базасының жазбалары, "Қызықты ономастика" қосымшасы үшін білім базасының құрылымы (100-ден астам семантикалық белгілер) және 700 білім базасының жазбалары, топономика бойынша білім базасының құрылымы және 1000 білім базасының жазбалары, сөйлеу синтезаторына арналған 50 сағаттық аудио корпус

На данном этапе внедрение не предусмотрено

Бұл кезеңде ендіру жоспарланбаған

Поскольку конечным результатом проекта будет конкурентоспособный готовый научно-технический продукт, то высокий уровень техники в предметной области проекта будет подтвержден использованием технологий объектно-ориентированного программирования, интернет-технологий, онтологий и интерфейсов, а также использование инструментов моделирования Protégé для создания интеллектуальных систем. Разработка научно-лингвистических основ и ИТ-ресурсов для повышения культуры и расширения функций казахского языка как языка межнационального общения в цифровом формате и возможности комплексного системного исследования Новые научные результаты в части научно-лингвистические основы казахского языка для различных интеллектуальных информационных систем, обрабатывающих естественный язык, - позволяет усилить экономическую эффективность и оказывает прямое экономическое влияние на развитие отрасли ИКТ Казахстана и качество цифровых услуг казахского языка. Оценка технико-экономической эффективности внедрения не проводилась, так как внедрение полученных на данном этапе результатов не предусмотрено.

Жобаның ақырғы нәтижесі бәсекеге қабілетті дайын ғылыми-техникалық өнім болатындықтан, жобаның пәндік саласындағы техниканың жоғары деңгейі объектіге бағытталған программалау технологиясын, интернет технологияларды, онтологиялар мен интерфейстерді құру және интеллектуалды жүйелерді құру үшін Protégé модельдеу құралдарын пайдалану арқылы дәлелденеді. Цифрлық форматтағы этносаралық қарым-қатынас тілі ретінде қазақ тілінің мәдениетін арттыру мен функцияларын кеңейту бойынша ғылыми-лингвистикалық негіздер мен IТ-ресурстарды әзірлеу мен кешенді жүйелік зерттеу мүмкіндігі табиғи тілді өңдейтін әр түрлі интеллектуалды ақпараттық жүйелер үшін қазақ тілініңң ғылыми-лингвистикалық негіздері бөлігінде жаңа ғылыми нәтижелер техникалық-экономикалық тиімділігін күшейтуге мүмкіндік береді және Қазақстан АКТ саласының және қазақ тілінің цифрлық қызметтер көрсету сапасының дамуына тікелей экономикалық әсер етеді. Ендірудің техникалық-экономикалық тиімділігін бағалау жүргізілмеді, өйткені осы кезеңде алынған нәтижелерді ендіру қарастырылмаған.

Освещение полученных результатов (предоставление научного наследия А.Байтурсынулы широкой общественности является одной из самых необходимых работ) и систем изучения языков, интеллектуального обучения, систем оценки знаний, языковых приложений, разработка электронных грамматических справочников, многоязычные электронные тезаурусы, мультимедийные системы вопросов и ответов, в колл-центрах, голосовые помощники, умные дома и др. имеет реальное практическое значение с точки зрения применения. А синтез речи казахского языка позволяет расширить функции казахского языка, развивать информационные ресурсы в цифровом формате, получать новые научные результаты в научно-лингвистических основах казахского языка для интеллектуальных информационных систем с различными возможностями.

Алынған нәтижелерді ағарту (А.Байтұрсынұлының ғылыми мұрасына қалың көпшілікке қолжетімді ету - аса қажетті жұмыстардың бірі) және тіл үйрену жүйелерде, интеллектуалды оқыту, білімді бағалау жүйелерінде, тілге байланысты қосымшаларда, электронды грамматикалық анықтамалықтарды әзірлеуде, көптілді электрондық тезаурустарда, мультимедиялық сұрақ-жауап жүйелерінде, кол-орталықтарда, дауыстық көмекшілерде, смарт үйлерде, және т.б. қолданыс тұрғысынан нақты практикалық маңыздылыққа ие. Ал қазақ тілінің сөйлеу синтезі қазақ тілінің функцияларын кеңейтуде, ақпараттық ресурстарды цифрлық форматта әзірлеуде және мүмкіндігі әртүрлі зияткерлік ақпараттық жүйелер үшін қазақ тілінің ғылыми-лингвистикалық негіздерінде жаңа ғылыми нәтижелер алуға мүмкіндік береді

UDC indices
004.8, 81'33
International classifier codes
20.23.25; 16.31.21; 28.23.39;
Readiness of the development for implementation
Key words in Russian
искусственный интеллект; компьютерная лингвистика; «Ахметтану»; синтез речи; формальное описание грамматики;
Key words in Kazakh
жасанды интеллект; компьютерлік лингвистика; «Ахметтану»; сөйлеу синтезі; грамматиканың формалды сипаттамасы;
Head of the organization Сыдыков Ерлан Батташевич /
Head of work Бекманова Гульмира Тылеубердиевна Кандидат технических наук, PhD / ассоциированный профессор
Native executive in charge