Information card

You have disabled JavaScript ... To complete the work, you must enable JavaScript in your browser

Inventory number	IRN	Number of state registration
0321РК00224	AP08053085-KC-21	0120РК00134
Document type	Terms of distribution	Availability of implementation
Краткие сведения	Gratis	Number of implementation: 0 Not implemented
Publications
Native publications: 0
International publications: 0	Publications Web of science: 0	Publications Scopus: 0
Patents	Amount of funding	Code of the program
0	18715774.16	AP08053085
Name of work
Разработка неконтролируемых методов и алгоритмов распознавания речи на основе не выровненных аудио и текстовых данных
Type of work	Source of funding	Report authors
Applied		Есенбаев Жандос Аманбаевич
Engineers from production 0 Undergraduates 0 Doctoral students 0 Foreign scientists 0
Customer		МНВО РК
Information on the executing organization
Short name of the ministry (establishment)		Нет
Full name of the service recipient
Частное учреждение "National Laboratory Astana"
Abbreviated name of the service recipient		National Laboratory Astana
Abstract
The object of research, development or design (in Russian) : Объектами исследования данного проекта являются аудио и текстовые данные на казахском и английском языках, а также современные методы и алгоритмы их обработки и анализа. The object of research, development or design (in Kazakh) : Бұл жобаның зерттеу нысандары - қазақ және ағылшын тілдеріндегі аудио және мәтіндік мәліметтер, сондай-ақ оларды өңдеу мен талдаудың заманауи әдістері мен алгоритмдері. Aim of work (in Russian) : Целью данного проекта является разработка неконтролируемых методов и алгоритмов для распознавания речи на основе не выровненных аудио и текстовых данных. Aim of work (in Kazakh) : Бұл жобаның мақсаты - реттелмеген аудио және мәтіндік деректер негізінде сөйлеуді танудың бақыланбайтын әдістері мен алгоритмдерін құру. Методы исследования (на русском) : В данной работе используются методы машинного обучения без учителя, искусственные нейронные сети и топологические методы для анализа и обработки аудио и текстовых данных. Методы исследования (на казахском) : Бұл жұмыста аудио және мәтіндік деректерді талдау және өңдеу үшін бақыланбайтын машиналық оқыту әдістер, жасанды нейрондық желілер және топологиялық әдістер қолданылады. Obtained results and novelty (in Russian) : За отчетный период мы провели предварительную работу по топологическому анализу аудио и текстовых данных для неконтролируемой обработки аудио и текстов. Работа основана на предположении, что частоты и контекстные отношения фонем аналогичны в акустической и текстовой областях для одного и того же языка. Соответственно, это позволило создать отображение между этими пространствами, которое учитывает их геометрическую структуру. В качестве первого этапа были выбраны генеративные методы, основанные на вариационных автокодерах, для отображения аудио и текстовые данные в скрытое векторное пространство. На следующем этапе использованы методы персистентной гомологий для анализа топологической структуры двух пространств. Хотя полученные результаты подтверждают идею сходства двух пространств, необходимы дальнейшие исследования, чтобы правильно сопоставить акустические и текстовые пространства, а также оценить реальный эффект включения топологической информации в процесс обучения автокодировщика. Кроме того, нами было разработано программное обеспечение в виде веб-приложения для визуализации акустических и текстовых данных. Obtained results and novelty (in Kazakh) : Есеп беру кезеңінде аудио мен мәтінді бақылаусыз өңдеу үшін аудио және мәтіндік деректерді топологиялық талдау бойынша алдын ала жұмыстар жүргіздік. Жұмыс фонемалардың жиіліктері мен контекстік байланыстары бір тілге арналған акустикалық және мәтіндік домендерде ұқсас деген болжамға негізделген. Тиісінше, бұл олардың геометриялық құрылымын ескеретін осы кеңістіктер арасында карта құруға мүмкіндік берді. Бірінші қадам ретінде дыбыстық және мәтіндік деректерді жасырын векторлық кеңістікке салыстыру үшін вариациялық автоматты кодерлерге негізделген генеративті әдістер таңдалды. Келесі кезеңде екі кеңістіктің топологиялық құрылымын талдау үшін тұрақты гомология әдістері қолданылады. Алынған нәтижелер екі кеңістіктің ұқсастығы туралы идеяны растағанымен, акустикалық және мәтіндік кеңістіктерді дұрыс сәйкестендіру үшін, сонымен қатар топологиялық ақпаратты автокодердің оқу процесіне қосудың нақты әсерін бағалау үшін қосымша зерттеулер қажет. Сонымен қатар, біз акустикалық және мәтіндік деректерді визуализациялауға арналған веб-қосымша түрінде бағдарламалық қамтамасыз етуді әзірледік. The main constructive and technical economic indicators (in Russian) : Процесс вычисления занимает для аудио данных до 3 часов, а для тестовых данных – до 1.5 часа. The main constructive and technical economic indicators (in Kazakh) : Есептеу процесі аудио деректер үшін 3 сағатқа дейін және сынақ деректері үшін 1,5 сағатқа дейін созылады. Level of implementation (in Russian) : Level of implementation (in Kazakh) : Efficiency (in Russian) : Efficiency (in Kazakh) : Field of application (in Russian) : Полученные результаты и разработанные программы могут быть востребованы в разработке систем автоматического распознавания речи и анализа многомерных данных. Field of application (in Kazakh) : Алынған нәтижелер мен әзірленген бағдарламалар сөйлеуді автоматты түрде тану мен көпөлшемді деректерді талдаудың жүйесін жасауда сұранысқа ие болуы мүмкін.
UDC indices
519.765
International classifier codes
16.31.21; 28.23.37;
Key words in Russian
акустическое моделирование; языковое моделирование; вложения слов; топологический анализ данных; симплициальные комплексы; персистентные гомологии; персистентные диаграммы;
Key words in Kazakh
акустикалық модельдеу; тілдік модельдеу; сөздердің ендірілуі; топологиялық деректерді талдау; симплициалдық комплекстер; персистентті гомологиялар; персистентті диаграммалар;
Head of the organization	Сарбасов Дос Джурмаханбет	Academic degree/title: Ph.D. / профессор
Head of work	Есенбаев Жандос Аманбаевич	Academic degree/title : PhD in Computer Science / нет

Eng

Қаз

Рус