Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0324РК00085 | AP23489529-KC-24 | 0124РК00280 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 0 | ||||
International publications: 1 | Publications Web of science: 0 | Publications Scopus: 0 | ||
Patents | Amount of funding | Code of the program | ||
0 | 33999939.6 | AP23489529 | ||
Name of work | ||||
Разработка методов и алгоритмов многоязычного и мультимодального преобразования речи в речь для академических лекций и докладов | ||||
Type of work | Source of funding | Report authors | ||
Applied | Кожирбаев Жанибек Мамбеткаримович | |||
0
0
1
1
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | Нет | |||
Full name of the service recipient | ||||
Частное учреждение "National Laboratory Astana" | ||||
Abbreviated name of the service recipient | National Laboratory Astana | |||
Abstract | ||||
Объектом исследования является процесс разработка многоязычных и мультимодальных методов и алгоритмов преобразования речи в речь для академических лекций и бесед. Зерттеу объектісі академиялық лекциялар мен баяндамалар үшін сөйлеуді сөйлеуге түрлендірудің көптілді және мультимодальды әдістері мен алгоритмдерін әзірлеу процесі болып табылады. Целью проекта является разработка многоязычных и мультимодальных методов и алгоритмов преобразования речи в речь для академических лекций и бесед. В качестве исходного предположения мы рассматриваем ситуацию, когда презентация или слайды представлены на казахском, русском или английском языке, а речь докладчика – на казахском языке. Жобаның мақсаты – академиялық лекциялар мен баяндамалар үшін көптілді және мультимодальды сөйлеуді сөйлеуге түрлендіру әдістері мен алгоритмдерін әзірлеу. Бастапқы болжам ретінде презентация немесе слайдтар қазақ, орыс немесе ағылшын тілдерінде ұсынылып, баяндамашының сөзі қазақ тілінде болған жағдайды қарастырамыз. В работе используются контролируемые и неконтролируемые методы машинного обучения, искусственные нейронные сети. Жұмыста машиналық оқытудың бақыланатын және бақыланбайтын әдістері, жасанды нейрондық желілер қолданылады. Значимость работы заключается в создании методов и алгоритмов перевода речи с использованием немаркированных аудио- и текстовых данных, а также предварительно обученных моделей. Жұмыстың маңыздылығы таңбаланбаған аудио және мәтіндік деректерді, сондай - ақ алдын-ала дайындалған модельдерді қолдана отырып, сөйлеуді аудару әдістері мен алгоритмдерін құру болып табылады. 60-часовой аннотированный аудиокорпус по ИТ-темам для адаптации (fine-tuning) предобученной модели распознавания казахской речи; текстовый корпус объемом 20 000 параллельных троек предложений на казахском, русском и английском языках по ИТ тематике для адаптации (fine-tuning) предобученной модели многоязычного казахско- русско-английского перевода; наборы данных, содержащие 50000 изображений текстовых строк для разработки отдельных моделей оптического распознавания символов казахского, русского и английского языков Алдын ала дайындалған қазақша сөйлеуді тану моделін дәл баптау үшін АТ тақырыптары бойынша 60 сағаттық аннотацияланған аудио корпус; көптілді қазақша-орысша-ағылшынша аударманың алдын ала дайындалған моделін дәл баптау үшін АТ тақырыптары бойынша қазақ, орыс және ағылшын тілдеріндегі 20 000 параллельді үш сөйлемнен тұратын мәтіндік корпус; қазақ, орыс және ағылшын тілдері үшін таңбаларды тануының жеке оптикалық моделін әзірлеу үшін мәтіндік жолдардың 50 000 кескінін қамтитын деректер жиыны На данном этапе внедрение не предусмотрено Бұл кезеңде ендіру жоспарланбаған Исследования, выполняемые в рамках настоящего научного проекта, обладают высокой экономической, социальной и индустриальной важностью, поскольку при дальнейшем изучении и внедрении результаты могут быть использованы для решения прикладных задач, связанных с разработкой систем перевода речи для родственных языков (узбекский, кыргызский) и других языков с ограниченными ресурсами. Осы ғылыми жоба аясында жүргізілген зерттеулердің жоғары экономикалық, әлеуметтік және өндірістік маңызы бар, өйткені одан әрі зерттеу және енгізу кезінде алынған нәтижелер туыстас тілдер (өзбек, қырғыз) және басқа да ресурстары шектеулі тілдер үшін сөйлеуді аудару жүйесін дамытуға қатысты қолданбалы мәселелерді шешу үшін пайдаланылуы мүмкін. Полученные результаты и разработанные модели нейронных сетей, а также программы могут быть использованы при разработке систем перевода речи. Алынған нәтижелер мен әзірленген нейрондық желі үлгілері, сондай-ақ бағдарламалар сөйлеуді аудару жүйелерін әзірлеуде пайдаланылуы мүмкін. |
||||
UDC indices | ||||
81'322; 004.934; 004.912; 004.93'1; 004.932 | ||||
International classifier codes | ||||
28.23.15; 16.31.21; | ||||
Key words in Russian | ||||
свозной перевод речи; оптическое распознавание символов; обработка речи; машинный перевод; переключение кода; | ||||
Key words in Kazakh | ||||
интегралдық сөйлеуді аудару; оптикалық таңбаны тану; сөйлеуді өңдеу; машиналық аударма; кодты ауыстыру; | ||||
Head of the organization | Сарбасов Дос Джурмаханбет | Ph.D. Биохимия и молекулярная биология / Профессор | ||
Head of work | Кожирбаев Жанибек Мамбеткаримович | Phd / PhD |