Information card

You have disabled JavaScript ... To complete the work, you must enable JavaScript in your browser

Inventory number	IRN	Number of state registration
0324РК00085	AP23489529-KC-24	0124РК00280
Document type	Terms of distribution	Availability of implementation
Краткие сведения	Gratis	Number of implementation: 0 Not implemented
Publications
Native publications: 0
International publications: 1	Publications Web of science: 0	Publications Scopus: 0
Patents	Amount of funding	Code of the program
0	33999939.6	AP23489529
Name of work
Разработка методов и алгоритмов многоязычного и мультимодального преобразования речи в речь для академических лекций и докладов
Type of work	Source of funding	Report authors
Applied		Кожирбаев Жанибек Мамбеткаримович
Engineers from production 0 Undergraduates 0 Doctoral students 1 Foreign scientists 1
Customer		МНВО РК
Information on the executing organization
Short name of the ministry (establishment)		Нет
Full name of the service recipient
Частное учреждение "National Laboratory Astana"
Abbreviated name of the service recipient		National Laboratory Astana
Abstract
The object of research, development or design (in Russian) : Объектом исследования является процесс разработка многоязычных и мультимодальных методов и алгоритмов преобразования речи в речь для академических лекций и бесед. The object of research, development or design (in Kazakh) : Зерттеу объектісі академиялық лекциялар мен баяндамалар үшін сөйлеуді сөйлеуге түрлендірудің көптілді және мультимодальды әдістері мен алгоритмдерін әзірлеу процесі болып табылады. Aim of work (in Russian) : Целью проекта является разработка многоязычных и мультимодальных методов и алгоритмов преобразования речи в речь для академических лекций и бесед. В качестве исходного предположения мы рассматриваем ситуацию, когда презентация или слайды представлены на казахском, русском или английском языке, а речь докладчика – на казахском языке. Aim of work (in Kazakh) : Жобаның мақсаты – академиялық лекциялар мен баяндамалар үшін көптілді және мультимодальды сөйлеуді сөйлеуге түрлендіру әдістері мен алгоритмдерін әзірлеу. Бастапқы болжам ретінде презентация немесе слайдтар қазақ, орыс немесе ағылшын тілдерінде ұсынылып, баяндамашының сөзі қазақ тілінде болған жағдайды қарастырамыз. Методы исследования (на русском) : В работе используются контролируемые и неконтролируемые методы машинного обучения, искусственные нейронные сети. Методы исследования (на казахском) : Жұмыста машиналық оқытудың бақыланатын және бақыланбайтын әдістері, жасанды нейрондық желілер қолданылады. Obtained results and novelty (in Russian) : Значимость работы заключается в создании методов и алгоритмов перевода речи с использованием немаркированных аудио- и текстовых данных, а также предварительно обученных моделей. Obtained results and novelty (in Kazakh) : Жұмыстың маңыздылығы таңбаланбаған аудио және мәтіндік деректерді, сондай - ақ алдын-ала дайындалған модельдерді қолдана отырып, сөйлеуді аудару әдістері мен алгоритмдерін құру болып табылады. The main constructive and technical economic indicators (in Russian) : 60-часовой аннотированный аудиокорпус по ИТ-темам для адаптации (fine-tuning) предобученной модели распознавания казахской речи; текстовый корпус объемом 20 000 параллельных троек предложений на казахском, русском и английском языках по ИТ тематике для адаптации (fine-tuning) предобученной модели многоязычного казахско- русско-английского перевода; наборы данных, содержащие 50000 изображений текстовых строк для разработки отдельных моделей оптического распознавания символов казахского, русского и английского языков The main constructive and technical economic indicators (in Kazakh) : Алдын ала дайындалған қазақша сөйлеуді тану моделін дәл баптау үшін АТ тақырыптары бойынша 60 сағаттық аннотацияланған аудио корпус; көптілді қазақша-орысша-ағылшынша аударманың алдын ала дайындалған моделін дәл баптау үшін АТ тақырыптары бойынша қазақ, орыс және ағылшын тілдеріндегі 20 000 параллельді үш сөйлемнен тұратын мәтіндік корпус; қазақ, орыс және ағылшын тілдері үшін таңбаларды тануының жеке оптикалық моделін әзірлеу үшін мәтіндік жолдардың 50 000 кескінін қамтитын деректер жиыны Level of implementation (in Russian) : На данном этапе внедрение не предусмотрено Level of implementation (in Kazakh) : Бұл кезеңде ендіру жоспарланбаған Efficiency (in Russian) : Исследования, выполняемые в рамках настоящего научного проекта, обладают высокой экономической, социальной и индустриальной важностью, поскольку при дальнейшем изучении и внедрении результаты могут быть использованы для решения прикладных задач, связанных с разработкой систем перевода речи для родственных языков (узбекский, кыргызский) и других языков с ограниченными ресурсами. Efficiency (in Kazakh) : Осы ғылыми жоба аясында жүргізілген зерттеулердің жоғары экономикалық, әлеуметтік және өндірістік маңызы бар, өйткені одан әрі зерттеу және енгізу кезінде алынған нәтижелер туыстас тілдер (өзбек, қырғыз) және басқа да ресурстары шектеулі тілдер үшін сөйлеуді аудару жүйесін дамытуға қатысты қолданбалы мәселелерді шешу үшін пайдаланылуы мүмкін. Field of application (in Russian) : Полученные результаты и разработанные модели нейронных сетей, а также программы могут быть использованы при разработке систем перевода речи. Field of application (in Kazakh) : Алынған нәтижелер мен әзірленген нейрондық желі үлгілері, сондай-ақ бағдарламалар сөйлеуді аудару жүйелерін әзірлеуде пайдаланылуы мүмкін.
UDC indices
81'322; 004.934; 004.912; 004.93'1; 004.932
International classifier codes
28.23.15; 16.31.21;
Key words in Russian
свозной перевод речи; оптическое распознавание символов; обработка речи; машинный перевод; переключение кода;
Key words in Kazakh
интегралдық сөйлеуді аудару; оптикалық таңбаны тану; сөйлеуді өңдеу; машиналық аударма; кодты ауыстыру;
Head of the organization	Сарбасов Дос Джурмаханбет	Academic degree/title: Ph.D. Биохимия и молекулярная биология / Профессор
Head of work	Кожирбаев Жанибек Мамбеткаримович	Academic degree/title : Phd / PhD

Eng

Қаз

Рус