Inventory number IRN Number of state registration
0225РК00038 AP19174298-OT-25 0123РК00176
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 1
International publications: 2 Publications Web of science: 0 Publications Scopus: 2
Number of books Appendicies Sources
1 4 42
Total number of pages Patents Illustrations
84 0 16
Amount of funding Code of the program Table
7848642 AP19174298 9
Name of work
Реализация системы многоуровневого языкового моделирования для языка со сложной морфологической структурой
Report title
Type of work Source of funding The product offerred for implementation
Applied Метод, способ
Report authors
Оралбекова Дина Орымбаевна , Мамырбаев Оркен Жумажанович ,
0
0
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Abbreviated name of the service recipient ИИВТ
Abstract

модели и методы многоуровневого языкового моделирования для морфологически сложного языка, компьютерная лингвистика

морфологиялық күрделі құрылымды тілдерге арналған көпдеңгейлі тілдік модельдеудің модельдері мен әдістері, компьютерлік лингвистика

разработка иерархической многоуровневой языковой модели для морфологически сложного языка с целью снижения разреженности данных и повышения обобщающей способности моделей при обработке текстов на казахском языке

мәтіндердің сиректігін төмендету және тілдік модельдердің жалпылау қабілетін арттыру мақсатында морфологиялық күрделі құрылымды тіл үшін иерархиялық көпдеңгейлі тілдік модель әзірлеу

Обработка естественного языка, машинное обучение, глубокое обучение

Табиғи тілді өңдеу, машиналық оқыту, терең оқыту

Разработаны концепции языкового моделирования морфологически сложного языка (MCЯ) с векторным представлением морфем и слов, собран корпус неразмеченных текстовых данных, достаточно большого объема и создан небольшой корпус размеченных данных для экспериментального оценивания языковой модели MСЯ в задачах классификации, анализа тональности и резюмирования текстов, разработаны статистический метод и метод многоуровневого языкового моделирования для MCЯ. Новизна: разработка иерархической многоуровневой языковой модели для морфологически сложных языков, основанной на представлении внутренней структуры слова.

Алынған нәтижелер: морфологиялық күрделі құрылымды тілге (МКТ) арналған тілдік модельдеудің морфема мен сөздердің векторлық көріністеріне негізделген тұжырымдамалары әзірленді; МКТ тілдік моделін тәжірибелік бағалауға арналған көлемі жеткілікті белгіленбеген мәтіндер корпусы және мәтіндерді классификациялау, тоналдылығын талдау мен рефераттау тапсырмалары үшін шағын көлемдегі белгіленген корпус дайындалды; МКТ үшін статистикалық әдіс және көпдеңгейлі тілдік модельдеу әдісі жасалды. Жаңалығы: қолданыстағы тілдік модельдерді талдау негізінде ішкі морфологиялық құрылымды ескеретін, морфологиялық құрылымы күрделі тілдерге арналған иерархиялық көпдеңгейлі тілдік модель әзірленді.

Основные конструктивные и технико-экономические показатели, эффективность: разработанная языковая модель имеет модульную архитектуру, включающую уровни морфем, слов и фраз, что обеспечивает высокую адаптивность к различным NLP-задачам.

Негізгі конструктивтік және техникалық-экономикалық көрсеткіштері, тиімділігі: әзірленген тілдік модель морфема, сөз және сөз тіркестері деңгейлерін қамтитын модульдік архитектураға ие, бұл оны әртүрлі табиғи тілді өңдеу тапсырмаларына бейімдеуге мүмкіндік береді.

Не внедрено

Енгізілмеген

Реализованные алгоритмы будут обеспечивать такие функции, как иерархическая многоуровневая модель морфологически сложного языка и модель обучения представлений на основе морфем, делая модель морфологически сложного языка способной к низкой разреженности данных и высокой способности к обобщению. Эти алгоритмы будут работать на больших неразмеченных наборах данных, кроме того, они могут быть применены к другим морфологически сложным языкам и другим задачам NLP.

Іске асырылатын алгоритмдер морфологиялық күрделі тілдің иерархиялық көп деңгейлі моделі және морфема негізіндегі оқыту моделі сияқты мүмкіндіктерді қамтамасыз етеді, бұл морфологиялық күрделі тіл моделін деректердің төмен сиректігі мен жоғары жалпылау қабілетіне қабілетті етеді. Бұл алгоритмдер үлкен таңбаланбаған деректер жиынында жұмыс істейді және басқа морфологиялық күрделі тілдерге және басқа NLP тапсырмаларына қолданылуы мүмкін.

разработанные модели и алгоритмы могут быть использованы в системах автоматического распознавания и синтеза речи, машинного перевода, интеллектуального поиска, проверки орфографии и грамматики, а также в других задачах обработки естественного языка для морфологически сложных языков.

әзірленген модельдер мен алгоритмдер автоматты сөйлеуді тану және синтездеу жүйелерінде, машиналық аудармада, интеллектуалды іздеу жүйелерінде, орфография мен грамматиканы тексеру құралдарында, сондай-ақ морфологиялық күрделі құрылымды тілдерге арналған басқа да табиғи тілді өңдеу тапсырмаларында қолданыла алады.

UDC indices
004. 89
International classifier codes
28.23.29;
Readiness of the development for implementation
Key words in Russian
языковая модель; морфологически сложный язык; нейронные сети; встраивание морфем/слов; прикладная лингвистика;
Key words in Kazakh
тілдік модель; морфологиялық күрделі тіл; нейрондық желілер; морфемаларды/сөздерді кірістіру; қолданбалы лингвистика;
Head of the organization Мутанов Галимкаир Мутанович Доктор технических наук / профессор
Head of work Оралбекова Дина Орымбаевна Phd / нет
Native executive in charge