Inventory number IRN Number of state registration
0220РК01025 AP05131415-OT-20 0118РК00545
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 2
International publications: 0 Publications Web of science: 1 Publications Scopus: 1
Number of books Appendicies Sources
0 2 38
Total number of pages Patents Illustrations
57 0 0
Amount of funding Code of the program Table
15000000 AP05131415 17
Name of work
Разработка и исследование системы нейронного машинного перевода казахского языка
Report title
Type of work Source of funding The product offerred for implementation
Applied Технология
Report authors
Тукеев Уалшер Ануарбекович , Әмірова Дина Тарихатқызы , Кәрібаева Айдана Сейілғазықызы , Рахимова Диана Рамазановна , Жуманов Жандос Маратович , Абдуали Балжан , Тұрғанбаева Әлия Оралбайқызы ,
0
3
2
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Дочернее Государственное предприятие на праве хозяйственного ведения "Научно-исследовательский институт математики и механики" Республиканского Государственного предприятие на праве хозяйственного ведения "Казахский Национальный университет им. Аль-Фараби"
Abbreviated name of the service recipient ДГП на ПВХ «НИИ ММ» РГП «КазНУ им. аль-Фараби»
Abstract

казахский, английский и русский языки

қазақ, ағылшын және орыс тілдері

разработка и исследование системы нейронного машинного перевода казахского языка

қазақ тілінің нейрондық машиналық аудармасын өндеу және зерттеу

модели, методы и программные средства нейронных сетей, нейронного машинного перевода

нейрондық желілердің және нейрондық машиналық аударудың, үлгілері, әдістері мен программалық құралдары

разработаны базовые версии нейронного машинного перевода (НМП) казахско-английской и казахско-русской пары языков; разработаны препроцессоры морфологической сегментации НМП казахско-английской и казахско-русской пар языков, новизной которых в использовании разработанной авторами CSE (Complete Set of Endings)-модели морфологии казахского языка, обеспечивающий сокращение объема словаря нейронной системы машинного перевода более, чем в два раза; разработаны новые синтетические параллельные корпусы казахско-английской и казахско-русской пар языков для обучения нейронного машинного перевода; разработана технология (метод) решения задачи неизвестных слов при нейронном машинном переводе казахского языка, новизна которой заключается в алгоритме поиска неизвестных слов в словаре обученной модели НМП и использовании словаря синонимов казахского языка; разработана технология нейронного машинного перевода казахско-английской и казахско-русской пар языков с морфологической сегментацией на основе LSTM модели нейронной сети, новизной которой является предложенная авторами морфологическая сегментация, основанная на CSE - модели морфологии казахского языка.

қазақ-ағылшын және қазақ-орыс тілдерінің жұптарының нейронды машиналық аудармасының (НМА) негізгі версиялары жасалды; қазақ-орыс тілдерінің жұптарының НМА жүйесінің морфологиялық сегменттеуіне арналған препроцессорлар жасалды, оның жаңалығы - авторлар ұсынған қазақ тілі морфологиясының CSE(Complete Set of Endings) - моделін қолдану, ол НМА жүйесі сөздігінің көлемін екі есе азайтады; нейронды-машиналық аударманы оқыту үшін қазақ-ағылшын, қазақ-орыс жұп тілдерінің жаңа синтетикалық параллель корпустары жасалды; қазақ тілінің нейронды-машиналық аудармасындағы белгісіз сөздер мәселесін шешудің технологиясы (әдісі) жасалды, оның жаңалығы үйретілген НМА моделінің сөздігінде белгісіз сөздерді іздеудің алгоритмінде және белгісіз сөзді мағынасы жағынан жақын сөзбен алмастыру үшін қолданылады; нейрондық желісінің LSTM моделіне негізделген морфологиялық сегментациямен қазақ-ағылшын, қазақ-орыс жұп тілдерінің НМА технологиясы жасалған, оның жаңалығы CSE - қазақ тілі морфологиясының моделі негізінде авторлар ұсынған морфологиялық сегментация.

заключается в создании технологий нейронного машинного перевода казахско-английской и казахско-русской пары языков на базе современных архитектур нейронных сетей с морфологической сегментации на основе полной системы окончаний казахского языка

қазақ тілінің жалғауларының толық жиынына негізделген морфологиялық сегменттелген заманауи нейрондық желінің архитектурасы негізінде қазақ-ағылшын және қазақ-орыс тілдерінің жұптары үшін нейрондық-машиналық аударма технологияларын құруда

По разработанным моделям и алгоритмам нейронного машинного перевода казахского языка созданы опытные образцы нейронного машинного перевода казахского языка для казахско-английской и казахско-русской пар языков, на которых проводились эксперименты с различными параметрами нейронного машинного перевода

Қазақ тілінің нейронды-машиналық аудармасының жасалған модельдері мен алгоритмдері бойынша қазақ-ағылшын және қазақ-орыс тілдерінің жұптары үшін қазақ тілінің нейронды-машиналық аудармасының прототиптері жасалды, оларда нейронды-машиналық аударманың әртүрлі параметрлерімен тәжірибелер жүргізілді.

Эффективность разработанные моделей и алгоритмов нейронного машинного перевода казахского языка заключается в учете лингвистических особенностей казахского языка, позволяющих получить более эффективные значения параметров системы нейронного машинного перевода, в частности, по объему памяти словарей системы.

Қазақ тілінің нейронды-машиналық аудармасының жасалынған модельдері мен алгоритмдерінің тиімділігі қазақ тілінің лингвистикалық ерекшеліктерін ескеруімен байланысты, бұл нейронды-машиналық аударма жүйесі параметрлерінің, әсіресе жүйелік сөздіктердің тиімді жады көлемін шығаруға мүмкіндік береді

Область применения: полученные результаты научно-технической деятельности по нейронному машинному переводу казахского языка могут быть применены в различных отраслях при переводе документации и текстовых материалов с казахского на английский(русский) языки и обратно.

Қолдану аясы: қазақ тілінің нейроннық-машиналық аудармасы бойынша ғылыми-техникалық қызметтің нәтижелерін құжаттар мен мәтіндік материалдарды қазақ тілінен ағылшын (орыс) тіліне және керісінше аудару кезінде әртүрлі салаларда қолдануға болады.

UDC indices
004.8, 004.912, 519.688
International classifier codes
20.19.27; 28.23.37;
Readiness of the development for implementation
Key words in Russian
Нейронный; машинный; перевод; казахский; русский; английский; язык;
Key words in Kazakh
Нейронды; машиналық; аударма; қазақ; орыс; ағылшын; тіл;
Head of the organization Кыдырбекулы Алматбек Балгабекович Доктор технических наук / профессор
Head of work Тукеев Уалшер Ануарбекович Доктор технических наук / профессор
Native executive in charge Әмірова Дина Тарихатқызы магистр