Inventory number | IRN | Number of state registration |
---|---|---|
0220РК01025 | AP05131415-OT-20 | 0118РК00545 |
Document type | Terms of distribution | Availability of implementation |
Заключительный | Gratis | Number of implementation: 0 Not implemented |
Publications | ||
Native publications: 2 | ||
International publications: 0 | Publications Web of science: 1 | Publications Scopus: 1 |
Number of books | Appendicies | Sources |
0 | 2 | 38 |
Total number of pages | Patents | Illustrations |
57 | 0 | 0 |
Amount of funding | Code of the program | Table |
15000000 | AP05131415 | 17 |
Name of work | ||
Разработка и исследование системы нейронного машинного перевода казахского языка | ||
Report title | ||
Type of work | Source of funding | The product offerred for implementation |
Applied | Технология | |
Report authors | ||
Тукеев Уалшер Ануарбекович , Әмірова Дина Тарихатқызы , Кәрібаева Айдана Сейілғазықызы , Рахимова Диана Рамазановна , Жуманов Жандос Маратович , Абдуали Балжан , Тұрғанбаева Әлия Оралбайқызы , | ||
0
3
2
0
|
||
Customer | МНВО РК | |
Information on the executing organization | ||
Short name of the ministry (establishment) | МНВО РК | |
Full name of the service recipient | ||
Дочернее Государственное предприятие на праве хозяйственного ведения "Научно-исследовательский институт математики и механики" Республиканского Государственного предприятие на праве хозяйственного ведения "Казахский Национальный университет им. Аль-Фараби" | ||
Abbreviated name of the service recipient | ДГП на ПВХ «НИИ ММ» РГП «КазНУ им. аль-Фараби» | |
Abstract | ||
казахский, английский и русский языки қазақ, ағылшын және орыс тілдері разработка и исследование системы нейронного машинного перевода казахского языка қазақ тілінің нейрондық машиналық аудармасын өндеу және зерттеу модели, методы и программные средства нейронных сетей, нейронного машинного перевода нейрондық желілердің және нейрондық машиналық аударудың, үлгілері, әдістері мен программалық құралдары разработаны базовые версии нейронного машинного перевода (НМП) казахско-английской и казахско-русской пары языков; разработаны препроцессоры морфологической сегментации НМП казахско-английской и казахско-русской пар языков, новизной которых в использовании разработанной авторами CSE (Complete Set of Endings)-модели морфологии казахского языка, обеспечивающий сокращение объема словаря нейронной системы машинного перевода более, чем в два раза; разработаны новые синтетические параллельные корпусы казахско-английской и казахско-русской пар языков для обучения нейронного машинного перевода; разработана технология (метод) решения задачи неизвестных слов при нейронном машинном переводе казахского языка, новизна которой заключается в алгоритме поиска неизвестных слов в словаре обученной модели НМП и использовании словаря синонимов казахского языка; разработана технология нейронного машинного перевода казахско-английской и казахско-русской пар языков с морфологической сегментацией на основе LSTM модели нейронной сети, новизной которой является предложенная авторами морфологическая сегментация, основанная на CSE - модели морфологии казахского языка. қазақ-ағылшын және қазақ-орыс тілдерінің жұптарының нейронды машиналық аудармасының (НМА) негізгі версиялары жасалды; қазақ-орыс тілдерінің жұптарының НМА жүйесінің морфологиялық сегменттеуіне арналған препроцессорлар жасалды, оның жаңалығы - авторлар ұсынған қазақ тілі морфологиясының CSE(Complete Set of Endings) - моделін қолдану, ол НМА жүйесі сөздігінің көлемін екі есе азайтады; нейронды-машиналық аударманы оқыту үшін қазақ-ағылшын, қазақ-орыс жұп тілдерінің жаңа синтетикалық параллель корпустары жасалды; қазақ тілінің нейронды-машиналық аудармасындағы белгісіз сөздер мәселесін шешудің технологиясы (әдісі) жасалды, оның жаңалығы үйретілген НМА моделінің сөздігінде белгісіз сөздерді іздеудің алгоритмінде және белгісіз сөзді мағынасы жағынан жақын сөзбен алмастыру үшін қолданылады; нейрондық желісінің LSTM моделіне негізделген морфологиялық сегментациямен қазақ-ағылшын, қазақ-орыс жұп тілдерінің НМА технологиясы жасалған, оның жаңалығы CSE - қазақ тілі морфологиясының моделі негізінде авторлар ұсынған морфологиялық сегментация. заключается в создании технологий нейронного машинного перевода казахско-английской и казахско-русской пары языков на базе современных архитектур нейронных сетей с морфологической сегментации на основе полной системы окончаний казахского языка қазақ тілінің жалғауларының толық жиынына негізделген морфологиялық сегменттелген заманауи нейрондық желінің архитектурасы негізінде қазақ-ағылшын және қазақ-орыс тілдерінің жұптары үшін нейрондық-машиналық аударма технологияларын құруда По разработанным моделям и алгоритмам нейронного машинного перевода казахского языка созданы опытные образцы нейронного машинного перевода казахского языка для казахско-английской и казахско-русской пар языков, на которых проводились эксперименты с различными параметрами нейронного машинного перевода Қазақ тілінің нейронды-машиналық аудармасының жасалған модельдері мен алгоритмдері бойынша қазақ-ағылшын және қазақ-орыс тілдерінің жұптары үшін қазақ тілінің нейронды-машиналық аудармасының прототиптері жасалды, оларда нейронды-машиналық аударманың әртүрлі параметрлерімен тәжірибелер жүргізілді. Эффективность разработанные моделей и алгоритмов нейронного машинного перевода казахского языка заключается в учете лингвистических особенностей казахского языка, позволяющих получить более эффективные значения параметров системы нейронного машинного перевода, в частности, по объему памяти словарей системы. Қазақ тілінің нейронды-машиналық аудармасының жасалынған модельдері мен алгоритмдерінің тиімділігі қазақ тілінің лингвистикалық ерекшеліктерін ескеруімен байланысты, бұл нейронды-машиналық аударма жүйесі параметрлерінің, әсіресе жүйелік сөздіктердің тиімді жады көлемін шығаруға мүмкіндік береді Область применения: полученные результаты научно-технической деятельности по нейронному машинному переводу казахского языка могут быть применены в различных отраслях при переводе документации и текстовых материалов с казахского на английский(русский) языки и обратно. Қолдану аясы: қазақ тілінің нейроннық-машиналық аудармасы бойынша ғылыми-техникалық қызметтің нәтижелерін құжаттар мен мәтіндік материалдарды қазақ тілінен ағылшын (орыс) тіліне және керісінше аудару кезінде әртүрлі салаларда қолдануға болады. |
||
UDC indices | ||
004.8, 004.912, 519.688 | ||
International classifier codes | ||
20.19.27; 28.23.37; | ||
Readiness of the development for implementation | ||
Key words in Russian | ||
Нейронный; машинный; перевод; казахский; русский; английский; язык; | ||
Key words in Kazakh | ||
Нейронды; машиналық; аударма; қазақ; орыс; ағылшын; тіл; | ||
Head of the organization | Кыдырбекулы Алматбек Балгабекович | Доктор технических наук / профессор |
Head of work | Тукеев Уалшер Ануарбекович | Доктор технических наук / профессор |
Native executive in charge | Әмірова Дина Тарихатқызы | магистр |