Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0322РК00062 | AP13068635-KC-22 | 0122РК00023 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 0 | ||||
International publications: 2 | Publications Web of science: 0 | Publications Scopus: 1 | ||
Patents | Amount of funding | Code of the program | ||
0 | 19980094 | AP13068635 | ||
Name of work | ||||
Разработка системы перевода речи для двух малоресурсных языков через некоторый промежуточный язык | ||||
Type of work | Source of funding | Report authors | ||
Applied | Кожирбаев Жанибек Мамбеткаримович | |||
4
0
0
0
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | Нет | |||
Full name of the service recipient | ||||
Частное учреждение "National Laboratory Astana" | ||||
Abbreviated name of the service recipient | National Laboratory Astana | |||
Abstract | ||||
Объектом исследования является процесс перевода речи для двух малоресурсных языков на основе предварительно обученных моделей с использованием некоторого промежуточного языка. Зерттеу объектісі болып кейбір аралық тілді пайдалана отырып, алдын ала дайындалған модельдер негізінде ресурстары аз екі тілге сөйлеуді аудару процесі табылады. Целью проекта является разработка методов и алгоритмов перевода речидля двух малоресурсных языков, а именно казахского и татарского, на основе предварительно обученных моделей с использованием некоторого промежуточного языка. Жобаның мақсаты таңбаланбаған аудио және мәтіндік деректерге, сондай-ақ кейбір аралық тіл арқылы алдын ала дайындалған модельдерге негізделген екі аз ресурсты қазақ және татар тілдеріне сөйлеуді аударудың әдістері мен алгоритмдерін әзірлеу болып табылады. В данной работе используются методы машинного обучения, искусственные нейронные сети и методы для анализа и обработки аудио и текстовых данных. Бұл жұмыста машиналық оқыту әдістері, жасанды нейрондық желілер және аудио және мәтіндік деректерді талдау және өңдеу әдістері қолданылады. За отчетный период были собраны акустические и текстовые данные. Были собраны аудиоданные без метки продолжительностью 1020 часов для казахского языка. Нами были проведена генерация коротких аудио-текстовых пар из оригинальных длинных аудиофайлов и соответствующих текстов. А объем текстовых данных составил более 1 миллиарда словоформ для казахского и татарского языков. Далее, мы разработали модели распознавания казахской речи на основе многослойных нейронных сетей на двух доступных наборах речевых данных: KazBNT и ISSAI KSC. Также мы разработали программный модуль системы каскадного перевода речи. Есепті кезеңде акустикалық және мәтіндік деректер жинақталды. Қазақ тілі үшін 1020 сағат құрайтын таңбаланбаған аудио деректер жиналды. Біз бастапқы ұзын аудио файлдар мен сәйкес мәтіндерден қысқа аудио-мәтін жұптарын жасадық. Ал мәтіндік деректердің көлемі қазақ және татар тілдері үшін 1 миллиардтан астам сөз формасын құрайды. Содан кейін біз екі қол жетімді сөйлеу деректер жинағында KazBNT және ISSAI KSC көпқабатты нейрондық желілер негізінде қазақ тілін тану модельдерін әзірледік. Сондай-ақ біз каскадты сөйлеуді аудару жүйесіне арналған бағдарламалық модуль әзірледік. Объем аудиоданных без метки составил 1020 часов, а объем текстовых данных – более 1 млрд словоформ для казахского и татарского языков. Расходование средств финансирования производится согласно утвержденной смете. Таңбаланбаған аудиомәліметтердің көлемі 1020 сағатты құраса, мәтіндік деректердің көлемі қазақ және татар тілдері үшін 1 миллиардтан астам сөз формасын құрады. Қаражат бекітілген бюджетке сәйкес жұмсалуда. Программный модуль каскадной системы речевого перевода доступен в виде демонстрационного веб-сервиса, обладающего функциональностью распознавания речи, машинного перевода и синтеза речи. Опубликованы научные статьи в рецензируемые издания. Каскадты сөйлеуді аудару жүйесінің бағдарламалық модулі сөйлеуді тану, машиналық аударма және сөйлеу синтезі функционалдығы бар демонстрациялық веб-қызмет ретінде қол жетімді. Рецензияланған басылымдарда ғылыми мақалалар жарияланды. Исследования, выполняемые в рамках настоящего научного проекта, обладают высокой экономической, социальной и индустриальной важностью, поскольку при дальнейшем изучении и внедрении результаты могут быть использованы для решения прикладных задач, связанных с разработкой систем перевода речи для родственных языков (узбекский, кыргызский) и других языков с ограниченными ресурсами. Осы ғылыми жоба аясында жүргізілген зерттеулердің жоғары экономикалық, әлеуметтік және өндірістік маңызы бар, өйткені одан әрі зерттеу және енгізу кезінде алынған нәтижелер туыстас тілдер (өзбек, қырғыз) және басқа да ресурстары шектеулі тілдер үшін сөйлеуді аудару жүйесін дамытуға қатысты қолданбалы мәселелерді шешу үшін пайдаланылуы мүмкін. Собранные акустические и текстовые данные, а также разработанные модули могут быть использованы в любой сфере, где востребована задача автоматического распознавания казахского языка и задача перевода казахского текста и речи. Жиналған акустикалық және мәтіндік деректер, сондай-ақ әзірленген модульдер қазақ тілін автоматты түрде тану және қазақ мәтіні мен сөйлеуін аудару міндеті сұранысқа ие кез келген салада қолданылуы мүмкін. |
||||
UDC indices | ||||
81'322; 004.934; 004.912; 004.93'1; 004.932 | ||||
International classifier codes | ||||
16.31.21; 28.23.15; | ||||
Key words in Russian | ||||
Перевод речи; Обработка речи; Машинный перевод; Каскадный перевод речи; Сквозной перевод речи; | ||||
Key words in Kazakh | ||||
Сөйлеу аудармасы; Сөйлеуді өңдеу; Машиналық аударма; Каскадты сөйлеу аудармасы; Сөйлеуді басынан аяғына дейін аудару; | ||||
Head of the organization | Сарбасов Дос Джурмаханбет | Ph.D. Biochemistry and Molecular Biology / Ph.D. | ||
Head of work | Кожирбаев Жанибек Мамбеткаримович | Phd / PhD |