Inventory number IRN Number of state registration
0321РК00462 AP08856034-KC-21 0120РК00414
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 2
International publications: 0 Publications Web of science: 0 Publications Scopus: 0
Patents Amount of funding Code of the program
0 19405986.5 AP08856034
Name of work
Робастное автоматическое распознавание речевых сигналов с самообучением
Type of work Source of funding Report authors
Applied Мусабаев Рустам Рафикович
0
0
1
1
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Abbreviated name of the service recipient ИИВТ
Abstract

Объектом исследования является речевой сигнал на естественном языке и методы машинного самообучения, применяемые для его анализа и распознавания.

Зерттеу объектісі табиғи тілдегі дыбыстық сигналды және оны талдау мен тану үшін қолданылатын машиналық өзін-өзі оқыту (self-learning) әдістерін зерттеу.

Целью данной работы является разработка комплекса алгоритмов позволяющих извлекать разноуровневую полезную информацию о структуре необработанного (сырого) речевого сигнала на неизвестном языке c использованием методов самообучения.

Жұмыстың мақсаты - өзін-өзі оқыту әдістерін қолдана отырып, белгісіз тілдегі өңделмеген дыбыстық сигналының құрылымы туралы мулти деңгейлі пайдалы ақпаратты алатын алгоритмдер жасау.

Для достижения цели и решения задач исследования на каждом этапе работ применялись различные методы и подходы, такие как: цифровая обработка сигналов, методы распознавания образов, компьютерная лингвистика, машинное обучение.

Жұмыстың әр кезеңіндегі мақсатқа жету және қатысты ғылыми мәселелерін шешу үшін әртүрлі әдістер мен тәсілдер қолданылды, мысалы: цифрлық сигналды өңдеу, үлгіні тану әдістері, есептеу лингвистикасы, машиналық оқыту.

Получены следующие основные результаты: 1) Разработаны робастные алгоритмы многоуровневой сегментации речевого сигнала и автоматической классификации полученных сегментов; 2) Получен алгоритм акустической сегментации речевого сигнала; 3) Получен алгоритм артикуляционной сегментации речевого сигнала; 4) Получен алгоритм микроволновой сегментации речевого сигнала на отрезки сопоставимые с периодом основного тона; 5) Получен алгоритм локального агрегирования микроволновых сегментов в более крупные субфонемные сегменты; 6) Получен алгоритм формирования инвентаря базовых субфонемных единиц составляющих физический уровень сигнала на основании анализа общности акустических и артикуляционных свойств полученного множества сегментов. Полученные результаты обладают новизной, соответствуют текущему уровню научно-технического развития и основаны на последних достижениях в области обработки данных на естественном языке, машинного и глубинного обучения, распознавания образов и др.

Қол жеткізілген нәтижелер: 1) Дыбыстық сигналды мулти деңгейлі сегменттеу және алынған сегменттерді автоматты түрде кластерлеу үшін тиімді (робасты) алгоритмдер әзірленді; 2) Дыбыстық сигналына акустикалық сегментация жасайтын алгоритмі дайындалды; 3) Дыбыстық сигналына артикуляциялық сегментация жасайтын алгоритмі әзірленді; 4) Дыбыстық сигналына негізгі тонның периодымен салыстырылатын микротолқындық сегментациялау алгоритмі дайындалды; 5) Микротолқынды сегменттерді ірі субфонемикалық сегменттерге айналдыратын локалдық біріктіру алгоритмі дайындалды; 6) Алынған сегменттер жиынтығының акустикалық және артикуляциялық қасиеттерінің жалпылығын талдау негізінде сигналдың физикалық деңгейін құрайтын негізгі субфонемикалық бірліктердің тізімдемесін қалыптастыру алгоритмі алынды. Алынған нәтижелер жаңа, ғылыми-техникалық дамудың қазіргі деңгейіне сәйкес келеді және табиғи тілдегі деректерді өңдеу, машиналық және терең оқыту (machine and deep learning), үлгіні тану және т.б. саласындағы соңғы жетістіктерге негізделген.

Осуществлена программная реализация разработанных алгоритмов на языке программирования Python. Сформированы различные наборы данных, которые использовались для апробации разработанных алгоритмов.

Әзірленген алгоритмдер Python бағдарламалау тілінде жасалды. Жасалған алгоритмдерді тексеру үшін әртүрлі деректер жинақтары құрылды және пайдаланылды.

Результаты НИР использованы при разработке робастных алгоритмов многоуровневой сегментации речевого сигнала и автоматической классификации полученных сегментов. Все выполненные работы направлены на получение единого конечного результата в виде разработанной информационной системы.

Ғылыми-зерттеу жұмыстың нәтижелері дыбыстық сигналыды мулти деңгейлі сегментациялау және алынған сегменттерді автоматты түрде классификациялау үшін тиімді алгоритмдерді әзірлеуде қолданылады. Барлық орындалған жұмыстар әзірленген ақпараттық жүйе түріндегі бір түпкілікті нәтиже алуға бағытталған.

Все разработанные методы были экспериментально апробированы на сформированном наборе данных. Получены численные оценки, подтверждающие эффективность разработанных алгоритмов.

Барлық әзірленген әдістер генерацияланған деректер жиынында эксперименталды түрде тексерілді. Жасалған алгоритмдердің тиімділігін растайтын сандық бағалау жүргізілді.

Разработанные алгоритмы применяются в составе информационных систем автоматического анализа и распознавания речевых сигналов.

Әзірленген алгоритмдер дыбыстық сигналдарын автоматты талдау және тану үшін ақпараттық жүйелердің бөлігітері ретінде пайдаланылады.

UDC indices
004.93
International classifier codes
28.23.15;
Key words in Russian
распознавание речи; распознавание образов; компьютерная лингвистика; цифровая обработка сигналов; кластерный анализ;
Key words in Kazakh
сөйлеуді тану; үлгіні тану; компьютерлік лингвистика; сандық сигналды өңдеу; кластерлік талдау;
Head of the organization Мутанов Галимкаир Мутанович Доктор технических наук / профессор
Head of work Мусабаев Рустам Рафикович Кандидат технических наук / ассоциированный профессор (доцент)