Inventory number IRN Number of state registration
0222РК00288 AP08053085-OT-22 0120РК00134
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 4
International publications: 3 Publications Web of science: 0 Publications Scopus: 2
Number of books Appendicies Sources
1 2 53
Total number of pages Patents Illustrations
60 0 29
Amount of funding Code of the program Table
18734156.67 AP08053085 2
Name of work
Разработка неконтролируемых методов и алгоритмов распознавания речи на основе не выровненных аудио и текстовых данных
Report title
Type of work Source of funding The product offerred for implementation
Applied Метод, способ
Report authors
Есенбаев Жандос Аманбаевич , Кожирбаев Жанибек Мамбеткаримович ,
0
0
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) Нет
Full name of the service recipient
Частное учреждение "National Laboratory Astana"
Abbreviated name of the service recipient National Laboratory Astana
Abstract

Объектами исследования данного проекта являются аудио и текстовые данные на казахском и английском языках, а также современные методы и алгоритмы их обработки и анализа.

Бұл жобаның зерттеу объектілері қазақ және ағылшын тілдеріндегі аудио және мәтіндік деректер, сондай-ақ оларды өңдеу мен талдаудың заманауи әдістері мен алгоритмдері болып табылады.

Целью данного проекта является разработка неконтролируемых методов и алгоритмов для распознавания речи на основе не выровненных аудио и текстовых данных.

Бұл жобаның мақсаты реттелмеген аудио және мәтіндік деректер негізінде сөйлеуді тану үшін бақылаусыз әдістер мен алгоритмдерді әзірлеу болып табылады.

В данной работе используются методы машинного обучения без учителя, искусственные нейронные сети и топологические методы для анализа и обработки аудио и текстовых данных.

Бұл құжат аудио және мәтіндік деректерді талдау және өңдеу үшін бақылаусыз машиналық оқыту әдістерін, жасанды нейрондық желілерді және топологиялық әдістерді пайдаланады.

Полученные результаты: - разработаны методы и алгоритмы топологического анализа аудио и текстовых данных; - разработана и обучена модель вариационного автоэнкодера; - реализован алгоритм вычисления расстояния Римана для персистентных диаграмм; - предложена модель распознавания речи, учитывающая топологическую структуру данных; - разработано веб-приложения для визуализации аудио и текстовых данных, представленных в векторном виде.

Нәтижелер: - дыбыстық және мәтіндік мәліметтерді топологиялық талдау әдістері мен алгоритмдері әзірленді; - вариациялық автокодер моделі әзірленді және оқытылды; - тұрақты диаграммалар үшін Риман қашықтығын есептеу алгоритмін жүзеге асырды; - топологиялық деректер құрылымын ескеретін сөйлеуді тану моделі ұсынылды; - векторлық формада ұсынылған аудио және мәтіндік деректерді визуализациялау үшін веб-қосымшаны әзірледі.

Вычислены расстояния Римана для диаграмм персистентности аудио и текстовых выборок, среднее значение которых равно 0.22, а дисперсия 0.09. Данный факт подтверждает гипотезу о схожести топологических структур аудио и текстовых пространств.

Риман қашықтықтары аудио және мәтін үлгілерінің тұрақтылық диаграммалары үшін есептеледі, олардың орташа мәні 0,22, ал дисперсиясы 0,09. Бұл факт аудио және мәтіндік кеңістіктердің топологиялық құрылымдарының ұқсастығы туралы гипотезаны растайды

Полученные результаты и разработанные программы могут быть внедрены в системах автоматического распознавания речи и анализа многомерных данных.

Алынған нәтижелер мен әзірленген бағдарламаларды автоматты түрде сөйлеуді тану және көп өлшемді деректерді талдау жүйелерінде енгізуге болады.

Системы автоматического распознавания речи и анализа многомерных данных.

Автоматты түрде сөйлеуді тану және көп өлшемді деректерді талдау жүйелері.

UDC indices
519.765
International classifier codes
16.31.21; 28.23.37;
Readiness of the development for implementation
Key words in Russian
акустическое моделирование; языковое моделирование; вложения слов; вариационные автоэнкодеры; топологический анализ данных; симплициальные комплексы; персистентные гомологии; персистентные диаграммы; расстояние римана;
Key words in Kazakh
акустикалық модельдеу; тілдік модельдеу; сөздердің ендірілуі; вариационды автоэнкодерлар; топологиялық деректерді талдау;; симплициалдық комплекстер; персистентті гомологиялар; персистентті диаграммалар; риман қашықттығы;
Head of the organization Д. Сарбасов Ph.D. / профессор
Head of work Есенбаев Жандос Аманбаевич PhD in Computer Science / нет
Native executive in charge