Inventory number IRN Number of state registration
0225РК01380 BR24993111-OT-25 0124РК01213
Document type Terms of distribution Availability of implementation
Промежуточный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 6
International publications: 4 Publications Web of science: 0 Publications Scopus: 4
Number of books Appendicies Sources
1 2 21
Total number of pages Patents Illustrations
61 0 5
Amount of funding Code of the program Table
235000000 О.1386 14
Code of the program's task under which the job is done
01
Name of work
Разработка системы синтеза речи на основе орфоэпической нормы казахского языка
Report title
Type of work Source of funding The product offerred for implementation
Applied Другая (укажите)
Report authors
Базарбаева Зейнеп Муслимовна , Аманбаева Айсауле Жантемировна , Жумабаева Жанара Толендиевна , Оспангазиева Назгуль Бакытовна , Рысберген Қыздархан Кұрмашқызы , Пашан Дана Мұсабекқызы , Тургинбаева Жазира Досымбековна , Бесиров Еркин Бекжанович , Бейсенхан Самал ,
0
0
3
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Республиканское государственное предприятие на праве хозяйственного пользования "Институт языкознания имени А.Байтурсынова"
Abbreviated name of the service recipient РГП на ПХВ "ИЯ им. А.Байтурсынова" КН МОН РК
Abstract

орфоэпия казахского языка; синтез казахской речи; акустические, артикуляционные, перцепционные описания гласных и согласных звуков; вариантные и вариационные изменения фонемы. Звуковой фонд казахского языка в сегментной фонетике для синтеза речи.

Қазақ тілінің орфоэпиялық нормасы; қазақ тіліндегі сөз синтезі; дауысты және дауыссыз дыбыстардың акустикалық, артикуляциялық және перцепциялық ерекшеліктері; фонеманың варианттары мен вариациялық түрленуі; қазақ тілінің дыбыс қоры.

Разработать систему синтеза речи, соответствующую орфоэпическим нормам казахского языка и предназначенную для образовательных платформ.

Білім беру платформаларына арналған қазақ тілінің орфоэпиялық нормаларына сай сөз синтезі жүйесін әзірлеу.

используются методы фонетико-фонологического анализа, просодического анализа, статистический метод, методы искусственного интеллекта и машинного обучения, алгоритмирования, моделирования, сравнительного анализа, параметрного синтеза, формантного синтеза, компилятивного синтеза, ономасиологического анализа, экспериментального анализа.

фонетика-фонологиялық талдау, просодикалық талдау, статистикалық әдіс, жасанды интеллект және мәшинелік оқыту әдістері, алгоритмдеу, модельдеу, компаративтік талдау, параметрлік синтездеу әдісі, форманттық синтездеу әдісі, компилятивтік синтездеу әдісі, ономасиологиялық талдау, эксперименттік талдау әдісі қолданылады.

По исследовательской работе получены следующие результаты: - 1 инструкция, серия видеороликов, 3 авторских свидетельства. - определены позиционные закономерности наименьших сегментов в казахском тексте для обеспечения наиболее близкого к естественно нормированному звучанию речи; - для того, чтобы фонд синтеза слов был обширным, аудио-и письменные версии казахских текстов на образовательных платформах были собраны и сбалансированы между собой; - разработан алгоритм изменения звуков внутри слова, в словах, между ритмической группой, поставлена просодическая разметка, чтобы слово могло быть синтезировано в соответствии с орфоэпической и просодической нормой; - для того, чтобы числовые символы на образовательных платформах звучали реалистично в соответствии с орфоэпической и просодической нормами, был разработан их запас и модель; - дано просодическое описание интонем, определенных в текстах образовательных платформ; - проведен анализ методов в современных системах синтеза; - 4 статьи в рецензируемых научных изданиях, индексируемых Social Science Citation Index или Arts and Humanities Citation Index базы данных Web of Science и (или) содержащих не менее 25 (двадцати пяти) процентилей по citescore в базе Scopus; - 6 статей в рецензируемых отечественных изданиях, рекомендованных КОКСНВО МНВО РК; - Проведен 1 круглый стол; - Организовано 2 научно-производственных семинара.

Зерттеу жұмысы бойынша төмендегідей нәтижелер алынды: - 1 нұсаулық, видеоролик топтамасы, 3 авторлық куәлік. - сөйлеудің табиғи нормаланған дыбысына неғұрлым жақын болуын қамтамасыз ету үшін қазақ мәтініндегі ең кіші сегменттердің позициялық заңдылықтары айқындалды; - сөз синтезінің қоры ауқымды болуы үшін білім беру платформаларындағы қазақ мәтіндерінің аудио мен жазба нұсқасы қатар жиналып, өзара теңестірілді; - сөз орфоэпиялық және просодикалық нормаға сәйкес шынайы синтезделуі үшін сөз ішіндегі, сөздер жігіндегі дыбыстардың, ырғақты топ арасындағы өзгерістердің алгоритмі жасалды, просодикалық белгіленімі қойылды; - білім беру платформаларындағы санмен жазылған таңбалардың орфоэпиялық және просодикалық нормаға сәйкес шынайы дыбысталуы үшін олардың қоры жасалып моделі берілді; - білім беру платформаларының мәтіндерінде анықталған интонемалардың просодикалық сипаттамасы берілді; - қазіргі синтездеу жүйелеріндегі әдістерге талдау жасалды. - Scopus базасында citescore бойынша кемінде 25 (жиырма бес) процентилі бар рецензияланатын ғылыми басылымдарда 4 мақала; - ҚР ҒЖБМ ҒЖБССҚК ұсынған рецензияланатын отандық басылымдарда 6 мақала; - 1 дөңгелек үстел өткізілді; - 2 ғылыми-өндірістік семинар ұйымдастырылды.

не предусмотрено

қарастырылмаған

не внедрено

енгізілмеген

Результаты исследования направлены на разработку современных IT-разработок в области речевых технологий и компьютерной лингвистики, а также на повышение языковой культуры общества. Кроме того, они способствуют увеличению объёма качественного цифрового контента на государственном языке. Создание первой IT-приложения для образовательных платформ, а также впервые разработанного научно-познавательного сайта «fonetika.kz» вносит значительный вклад в развитие таких научных направлений, как нейролингвистика, интонология, компьютерная лингвистика, экспериментальная фонетика и других смежных областей.

Зерттеу нәтижелері сөйлеу технологиялары мен компьютерлік лингвистика саласындағы заманауи IT-әзірлемелерді жасауға, қоғамның тіл мәдениетін арттыруға бағытталды. Сонымен қатар, ол мемлекеттік тілдегі цифрланған сапалы контенттің көлемін ұлғайтуға ықпал етеді. Білім беру платформаларына арналған тұңғыш IT-қосымшаның әзірленуі, сондай-ақ «fonetika.kz» ғылыми-танымдық сайтының алғаш рет құрылуы сияқты нәтижелер нейролингвистика, интонология, компьютерлік лингвистика, эксперименттік фонетика және басқа да ғылым салаларының дамуына елеулі үлес қосады.

Результаты проекта применяются в различных областях лингвистики и компьютерной лингвистики, разработке программных приложений, написании и методике учебников, среднем и высшем образовании, преподавании казахского языка на разных уровнях.

Жоба нәтижелері тіл білімі мен компьютерлік лингвистиканың түрлі салаларында, бағдарламалық қосымшаларды әзірлеуде, оқулық жазу мен әдістемеде; орта және жоғары білім беру, қазақ тілін түрлі деңгейде оқыту салаларында қолданылады.

UDC indices
8'81
International classifier codes
16.00.00;
Readiness of the development for implementation
Key words in Russian
синтез; орфоэпия; просодика; гласные; согласные; нейронная сеть;
Key words in Kazakh
синтез; орфоэпия; просодика; дауысты; дауыссыз; нейрондық желі;
Head of the organization Фазылжанова Анар Муратовна Кандидат филологических наук / қауымдастырылған профессор
Head of work Базарбаева Зейнеп Муслимовна Доктор филологических наук / профессор
Native executive in charge