Inventory number | IRN | Number of state registration |
---|---|---|
0223РК00220 | BR11765535-OT-23 | 0122РК00013 |
Document type | Terms of distribution | Availability of implementation |
Заключительный | Gratis | Number of implementation: 0 Not implemented |
Publications | ||
Native publications: 2 | ||
International publications: 4 | Publications Web of science: 1 | Publications Scopus: 3 |
Number of books | Appendicies | Sources |
1 | 5 | 77 |
Total number of pages | Patents | Illustrations |
181 | 0 | 106 |
Amount of funding | Code of the program | Table |
104514973.53 | О.1052 | 3 |
Code of the program's task under which the job is done | ||
01 | ||
Name of work | ||
Разработка научно-лингвистических основ и IT-ресурсов по расширению функций и повышению культуры казахского языка | ||
Report title | ||
Type of work | Source of funding | The product offerred for implementation |
Applied | Технология,Метод, способ,Модель,Базы, банки данных | |
Report authors | ||
Бекманова Гульмира Тылеубердиевна , Шәріпбай Алтынбек Әмірұлы , Сыздыкова Гульбаршин , Онгарбаев Еркин Ануарович , Есенбаев Жандос Аманбаевич , Омарбекова Асель Сайлаубековна , Разахова Бибигул Шамшановна , Ергеш Бану Жантуғанқызы , Жеткенбай Лена , Кожирбаев Жанибек Мамбеткаримович , Жумагулова Айша Алгабековна , Аскарова Сандугаш , Зулхажав Алтанбек , Елибаева Газиза Казбековна , Кабдылова Динара Долелкановна , Тилеухан Айбол , Амангелді Нұрзада , Сайранбекова Аяулым Данияровна , Орынбай Лаура Орынбайқызы , | ||
5
0
2
0
|
||
Customer | МНВО РК | |
Information on the executing organization | ||
Short name of the ministry (establishment) | МНВО РК | |
Full name of the service recipient | ||
Некоммерческое акционерное общество "Евразийский Национальный университет имени Л.Н. Гумилева" | ||
Abbreviated name of the service recipient | НАО "ЕНУ им.Л.Н.Гумилева" | |
Abstract | ||
Объектом исследования является казахский язык (текст, речь). Зерттеу нысаны қазақ тілі (мәтін, сөйлеу) болып табылады. Цель работы - разработка научно-лингвистических основ и IT-ресурсов по расширению функций и повышению культуры казахского языка, как языка межэтнического общения в цифровом формате. Жұмыстың мақсаты- цифрлық форматта этносаралық қарым-қатынас тілі ретінде қазақ тілінің функциялары мен мәдениетін арттыру үшін ғылыми-лингвистикалық негіздер мен IT-ресурстарды әзірлеу. Основной идеей данной программы является решение поставленных задач с помощью методов лингвистики и искусственного интеллекта через формализованное и семантическое описание казахского языка, построение предикативных баз знаний и программной реализации полученных моделей и методов. Бұл программаның негізгі идеясы қазақ тілінің формальды және семантикалық сипаттамасы арқылы лингвистика мен жасанды интеллект әдістерін қолдана отырып қойылған міндеттерді шешу, алынған модельдер мен әдістердің предикативті білім базаларын құру және программалық іске асыру болып табылады. - Разработано интеллектуальное приложение – синонимайзер стандартных образцов синонимического ряда слов в текстах общественно-политического дискурса и публичной речи. -Разработан грамматический электронный справочник грамматики современного казахского языка, состоящий из формального описания грамматики казахского языка. -Разработано мобильное приложение «Увлекательная ономастика». -Разработан электронный словарь терминологии школьных учебников. -Разработана интегральная модель (end-to-end) для синтеза казахской речи, состоящая математических моделей основе скрытых марковских моделей (НММ) - смеси гауссовских распределений (GMM) и интегральных систем (end-to-end) -Разработана информационная система для синтеза речи казахского языка. -Разработана интеллектуальная система «Ахметтану», состоящая из базы данных по научному наследию Ахмета Байтурсынулы и новые системы знаний по всем структурным ярусам языка в свете его учений, онтологические модели по всем структурным ярусам языка по наследию Ахмета Байтурсынулы. - Қоғамдық-саяси дискурс пен көпшілік алдында сөйлеу мәтіндерінің синонимдік қатарының стандартты үлгілері бар синонимайзер интеллектуалды қосымшасы әзірленді. -Қазақ тілінің грамматикасын формалды сипаттаудан тұратын қазіргі қазақ тілі грамматикасының грамматикалық электронды анықтамалығы әзірленді. - «Қызықты ономастика» мобильді қосымшасы. -Мектеп оқулықтары терминологиясының электронды сөздігі. -Гаус үлестірімдері (GMM) мен интегралды жүйе (end-to-end) қоспасынан құралған жасырын Марк моделі негізіндегі математикалық модельден қазақша сөйлеу синтезіне арналған интегралды модель (end-to-end). -Қазақ тілінің сөйлеу синтезіне арналған ақпараттық жүйе әзірленді. -Ахмет Байтұрсынұлының ғылыми мұрасы деректер базасынан және оның оқулары бойынша барлық құрылымдық қабаттары бар жаңа білім жүйесінен, сонымен қатар оның оқулары бойынша тілдің барлық құрылымдық қабаттары бойынша білімнің онтологиялық моделінен тұратын «Ахметтану» интеллектуалды жүйесі әзірленді. 500 страниц текстов политического дискурса, структура базы знаний и 1000 записей базы знаний для синонимайзера, структура базы знаний (более 100 семантических признака) и 700 записей базы знаний для приложения "Увлекательная ономастика", структура базы знаний и 1000 записей базы знаний по топономике, аудиокорпус для синтезатора речи 50 часов. Синонимайзерге арналған 500 бет саяси дискурс мәтіндері, білім базасының құрылымы және 1000 білім базасының жазбалары, "Қызықты ономастика" қосымшасы үшін білім базасының құрылымы (100-ден астам семантикалық белгілер) және 700 білім базасының жазбалары, топономика бойынша білім базасының құрылымы және 1000 білім базасының жазбалары, сөйлеу синтезаторына арналған 50 сағаттық аудио корпус На данном этапе внедрение не предусмотрено Бұл кезеңде ендіру жоспарланбаған Поскольку конечным результатом проекта будет конкурентоспособный готовый научно-технический продукт, то высокий уровень техники в предметной области проекта будет подтвержден использованием технологий объектно-ориентированного программирования, интернет-технологий, онтологий и интерфейсов, а также использование инструментов моделирования Protégé для создания интеллектуальных систем. Разработка научно-лингвистических основ и ИТ-ресурсов для повышения культуры и расширения функций казахского языка как языка межнационального общения в цифровом формате и возможности комплексного системного исследования Новые научные результаты в части научно-лингвистические основы казахского языка для различных интеллектуальных информационных систем, обрабатывающих естественный язык, - позволяет усилить экономическую эффективность и оказывает прямое экономическое влияние на развитие отрасли ИКТ Казахстана и качество цифровых услуг казахского языка. Оценка технико-экономической эффективности внедрения не проводилась, так как внедрение полученных на данном этапе результатов не предусмотрено. Жобаның ақырғы нәтижесі бәсекеге қабілетті дайын ғылыми-техникалық өнім болатындықтан, жобаның пәндік саласындағы техниканың жоғары деңгейі объектіге бағытталған программалау технологиясын, интернет технологияларды, онтологиялар мен интерфейстерді құру және интеллектуалды жүйелерді құру үшін Protégé модельдеу құралдарын пайдалану арқылы дәлелденеді. Цифрлық форматтағы этносаралық қарым-қатынас тілі ретінде қазақ тілінің мәдениетін арттыру мен функцияларын кеңейту бойынша ғылыми-лингвистикалық негіздер мен IТ-ресурстарды әзірлеу мен кешенді жүйелік зерттеу мүмкіндігі табиғи тілді өңдейтін әр түрлі интеллектуалды ақпараттық жүйелер үшін қазақ тілініңң ғылыми-лингвистикалық негіздері бөлігінде жаңа ғылыми нәтижелер техникалық-экономикалық тиімділігін күшейтуге мүмкіндік береді және Қазақстан АКТ саласының және қазақ тілінің цифрлық қызметтер көрсету сапасының дамуына тікелей экономикалық әсер етеді. Ендірудің техникалық-экономикалық тиімділігін бағалау жүргізілмеді, өйткені осы кезеңде алынған нәтижелерді ендіру қарастырылмаған. Освещение полученных результатов (предоставление научного наследия А.Байтурсынулы широкой общественности является одной из самых необходимых работ) и систем изучения языков, интеллектуального обучения, систем оценки знаний, языковых приложений, разработка электронных грамматических справочников, многоязычные электронные тезаурусы, мультимедийные системы вопросов и ответов, в колл-центрах, голосовые помощники, умные дома и др. имеет реальное практическое значение с точки зрения применения. А синтез речи казахского языка позволяет расширить функции казахского языка, развивать информационные ресурсы в цифровом формате, получать новые научные результаты в научно-лингвистических основах казахского языка для интеллектуальных информационных систем с различными возможностями. Алынған нәтижелерді ағарту (А.Байтұрсынұлының ғылыми мұрасына қалың көпшілікке қолжетімді ету - аса қажетті жұмыстардың бірі) және тіл үйрену жүйелерде, интеллектуалды оқыту, білімді бағалау жүйелерінде, тілге байланысты қосымшаларда, электронды грамматикалық анықтамалықтарды әзірлеуде, көптілді электрондық тезаурустарда, мультимедиялық сұрақ-жауап жүйелерінде, кол-орталықтарда, дауыстық көмекшілерде, смарт үйлерде, және т.б. қолданыс тұрғысынан нақты практикалық маңыздылыққа ие. Ал қазақ тілінің сөйлеу синтезі қазақ тілінің функцияларын кеңейтуде, ақпараттық ресурстарды цифрлық форматта әзірлеуде және мүмкіндігі әртүрлі зияткерлік ақпараттық жүйелер үшін қазақ тілінің ғылыми-лингвистикалық негіздерінде жаңа ғылыми нәтижелер алуға мүмкіндік береді |
||
UDC indices | ||
004.8, 81'33 | ||
International classifier codes | ||
20.23.25; 16.31.21; 28.23.39; | ||
Readiness of the development for implementation | ||
Key words in Russian | ||
искусственный интеллект; компьютерная лингвистика; «Ахметтану»; синтез речи; формальное описание грамматики; | ||
Key words in Kazakh | ||
жасанды интеллект; компьютерлік лингвистика; «Ахметтану»; сөйлеу синтезі; грамматиканың формалды сипаттамасы; | ||
Head of the organization | Сыдыков Ерлан Батташевич | / |
Head of work | Бекманова Гульмира Тылеубердиевна | Кандидат технических наук, PhD / ассоциированный профессор |
Native executive in charge |