Inventory number IRN Number of state registration
0324РК00085 AP23489529-KC-24 0124РК00280
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 1 Publications Web of science: 0 Publications Scopus: 0
Patents Amount of funding Code of the program
0 33999939.6 AP23489529
Name of work
Разработка методов и алгоритмов многоязычного и мультимодального преобразования речи в речь для академических лекций и докладов
Type of work Source of funding Report authors
Applied Кожирбаев Жанибек Мамбеткаримович
0
0
1
1
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) Нет
Full name of the service recipient
Частное учреждение "National Laboratory Astana"
Abbreviated name of the service recipient National Laboratory Astana
Abstract

Объектом исследования является процесс разработка многоязычных и мультимодальных методов и алгоритмов преобразования речи в речь для академических лекций и бесед.

Зерттеу объектісі академиялық лекциялар мен баяндамалар үшін сөйлеуді сөйлеуге түрлендірудің көптілді және мультимодальды әдістері мен алгоритмдерін әзірлеу процесі болып табылады.

Целью проекта является разработка многоязычных и мультимодальных методов и алгоритмов преобразования речи в речь для академических лекций и бесед. В качестве исходного предположения мы рассматриваем ситуацию, когда презентация или слайды представлены на казахском, русском или английском языке, а речь докладчика – на казахском языке.

Жобаның мақсаты – академиялық лекциялар мен баяндамалар үшін көптілді және мультимодальды сөйлеуді сөйлеуге түрлендіру әдістері мен алгоритмдерін әзірлеу. Бастапқы болжам ретінде презентация немесе слайдтар қазақ, орыс немесе ағылшын тілдерінде ұсынылып, баяндамашының сөзі қазақ тілінде болған жағдайды қарастырамыз.

В работе используются контролируемые и неконтролируемые методы машинного обучения, искусственные нейронные сети.

Жұмыста машиналық оқытудың бақыланатын және бақыланбайтын әдістері, жасанды нейрондық желілер қолданылады.

Значимость работы заключается в создании методов и алгоритмов перевода речи с использованием немаркированных аудио- и текстовых данных, а также предварительно обученных моделей.

Жұмыстың маңыздылығы таңбаланбаған аудио және мәтіндік деректерді, сондай - ақ алдын-ала дайындалған модельдерді қолдана отырып, сөйлеуді аудару әдістері мен алгоритмдерін құру болып табылады.

60-часовой аннотированный аудиокорпус по ИТ-темам для адаптации (fine-tuning) предобученной модели распознавания казахской речи; текстовый корпус объемом 20 000 параллельных троек предложений на казахском, русском и английском языках по ИТ тематике для адаптации (fine-tuning) предобученной модели многоязычного казахско- русско-английского перевода; наборы данных, содержащие 50000 изображений текстовых строк для разработки отдельных моделей оптического распознавания символов казахского, русского и английского языков

Алдын ала дайындалған қазақша сөйлеуді тану моделін дәл баптау үшін АТ тақырыптары бойынша 60 сағаттық аннотацияланған аудио корпус; көптілді қазақша-орысша-ағылшынша аударманың алдын ала дайындалған моделін дәл баптау үшін АТ тақырыптары бойынша қазақ, орыс және ағылшын тілдеріндегі 20 000 параллельді үш сөйлемнен тұратын мәтіндік корпус; қазақ, орыс және ағылшын тілдері үшін таңбаларды тануының жеке оптикалық моделін әзірлеу үшін мәтіндік жолдардың 50 000 кескінін қамтитын деректер жиыны

На данном этапе внедрение не предусмотрено

Бұл кезеңде ендіру жоспарланбаған

Исследования, выполняемые в рамках настоящего научного проекта, обладают высокой экономической, социальной и индустриальной важностью, поскольку при дальнейшем изучении и внедрении результаты могут быть использованы для решения прикладных задач, связанных с разработкой систем перевода речи для родственных языков (узбекский, кыргызский) и других языков с ограниченными ресурсами.

Осы ғылыми жоба аясында жүргізілген зерттеулердің жоғары экономикалық, әлеуметтік және өндірістік маңызы бар, өйткені одан әрі зерттеу және енгізу кезінде алынған нәтижелер туыстас тілдер (өзбек, қырғыз) және басқа да ресурстары шектеулі тілдер үшін сөйлеуді аудару жүйесін дамытуға қатысты қолданбалы мәселелерді шешу үшін пайдаланылуы мүмкін.

Полученные результаты и разработанные модели нейронных сетей, а также программы могут быть использованы при разработке систем перевода речи.

Алынған нәтижелер мен әзірленген нейрондық желі үлгілері, сондай-ақ бағдарламалар сөйлеуді аудару жүйелерін әзірлеуде пайдаланылуы мүмкін.

UDC indices
81'322; 004.934; 004.912; 004.93'1; 004.932
International classifier codes
28.23.15; 16.31.21;
Key words in Russian
свозной перевод речи; оптическое распознавание символов; обработка речи; машинный перевод; переключение кода;
Key words in Kazakh
интегралдық сөйлеуді аудару; оптикалық таңбаны тану; сөйлеуді өңдеу; машиналық аударма; кодты ауыстыру;
Head of the organization Сарбасов Дос Джурмаханбет Ph.D. Биохимия и молекулярная биология / Профессор
Head of work Кожирбаев Жанибек Мамбеткаримович Phd / PhD