| Inventory number | IRN | Number of state registration |
|---|---|---|
| 0225РК00038 | AP19174298-OT-25 | 0123РК00176 |
| Document type | Terms of distribution | Availability of implementation |
| Заключительный | Gratis | Number of implementation: 0 Not implemented |
| Publications | ||
| Native publications: 1 | ||
| International publications: 2 | Publications Web of science: 0 | Publications Scopus: 2 |
| Number of books | Appendicies | Sources |
| 1 | 4 | 42 |
| Total number of pages | Patents | Illustrations |
| 84 | 0 | 16 |
| Amount of funding | Code of the program | Table |
| 7848642 | AP19174298 | 9 |
| Name of work | ||
| Реализация системы многоуровневого языкового моделирования для языка со сложной морфологической структурой | ||
| Report title | ||
| Type of work | Source of funding | The product offerred for implementation |
| Applied | Метод, способ | |
| Report authors | ||
| Оралбекова Дина Орымбаевна , Мамырбаев Оркен Жумажанович , | ||
|
0
0
0
0
|
||
| Customer | МНВО РК | |
| Information on the executing organization | ||
| Short name of the ministry (establishment) | МНВО РК | |
| Full name of the service recipient | ||
| РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК | ||
| Abbreviated name of the service recipient | ИИВТ | |
| Abstract | ||
|
модели и методы многоуровневого языкового моделирования для морфологически сложного языка, компьютерная лингвистика морфологиялық күрделі құрылымды тілдерге арналған көпдеңгейлі тілдік модельдеудің модельдері мен әдістері, компьютерлік лингвистика разработка иерархической многоуровневой языковой модели для морфологически сложного языка с целью снижения разреженности данных и повышения обобщающей способности моделей при обработке текстов на казахском языке мәтіндердің сиректігін төмендету және тілдік модельдердің жалпылау қабілетін арттыру мақсатында морфологиялық күрделі құрылымды тіл үшін иерархиялық көпдеңгейлі тілдік модель әзірлеу Обработка естественного языка, машинное обучение, глубокое обучение Табиғи тілді өңдеу, машиналық оқыту, терең оқыту Разработаны концепции языкового моделирования морфологически сложного языка (MCЯ) с векторным представлением морфем и слов, собран корпус неразмеченных текстовых данных, достаточно большого объема и создан небольшой корпус размеченных данных для экспериментального оценивания языковой модели MСЯ в задачах классификации, анализа тональности и резюмирования текстов, разработаны статистический метод и метод многоуровневого языкового моделирования для MCЯ. Новизна: разработка иерархической многоуровневой языковой модели для морфологически сложных языков, основанной на представлении внутренней структуры слова. Алынған нәтижелер: морфологиялық күрделі құрылымды тілге (МКТ) арналған тілдік модельдеудің морфема мен сөздердің векторлық көріністеріне негізделген тұжырымдамалары әзірленді; МКТ тілдік моделін тәжірибелік бағалауға арналған көлемі жеткілікті белгіленбеген мәтіндер корпусы және мәтіндерді классификациялау, тоналдылығын талдау мен рефераттау тапсырмалары үшін шағын көлемдегі белгіленген корпус дайындалды; МКТ үшін статистикалық әдіс және көпдеңгейлі тілдік модельдеу әдісі жасалды. Жаңалығы: қолданыстағы тілдік модельдерді талдау негізінде ішкі морфологиялық құрылымды ескеретін, морфологиялық құрылымы күрделі тілдерге арналған иерархиялық көпдеңгейлі тілдік модель әзірленді. Основные конструктивные и технико-экономические показатели, эффективность: разработанная языковая модель имеет модульную архитектуру, включающую уровни морфем, слов и фраз, что обеспечивает высокую адаптивность к различным NLP-задачам. Негізгі конструктивтік және техникалық-экономикалық көрсеткіштері, тиімділігі: әзірленген тілдік модель морфема, сөз және сөз тіркестері деңгейлерін қамтитын модульдік архитектураға ие, бұл оны әртүрлі табиғи тілді өңдеу тапсырмаларына бейімдеуге мүмкіндік береді. Не внедрено Енгізілмеген Реализованные алгоритмы будут обеспечивать такие функции, как иерархическая многоуровневая модель морфологически сложного языка и модель обучения представлений на основе морфем, делая модель морфологически сложного языка способной к низкой разреженности данных и высокой способности к обобщению. Эти алгоритмы будут работать на больших неразмеченных наборах данных, кроме того, они могут быть применены к другим морфологически сложным языкам и другим задачам NLP. Іске асырылатын алгоритмдер морфологиялық күрделі тілдің иерархиялық көп деңгейлі моделі және морфема негізіндегі оқыту моделі сияқты мүмкіндіктерді қамтамасыз етеді, бұл морфологиялық күрделі тіл моделін деректердің төмен сиректігі мен жоғары жалпылау қабілетіне қабілетті етеді. Бұл алгоритмдер үлкен таңбаланбаған деректер жиынында жұмыс істейді және басқа морфологиялық күрделі тілдерге және басқа NLP тапсырмаларына қолданылуы мүмкін. разработанные модели и алгоритмы могут быть использованы в системах автоматического распознавания и синтеза речи, машинного перевода, интеллектуального поиска, проверки орфографии и грамматики, а также в других задачах обработки естественного языка для морфологически сложных языков. әзірленген модельдер мен алгоритмдер автоматты сөйлеуді тану және синтездеу жүйелерінде, машиналық аудармада, интеллектуалды іздеу жүйелерінде, орфография мен грамматиканы тексеру құралдарында, сондай-ақ морфологиялық күрделі құрылымды тілдерге арналған басқа да табиғи тілді өңдеу тапсырмаларында қолданыла алады. |
||
| UDC indices | ||
| 004. 89 | ||
| International classifier codes | ||
| 28.23.29; | ||
| Readiness of the development for implementation | ||
| Key words in Russian | ||
| языковая модель; морфологически сложный язык; нейронные сети; встраивание морфем/слов; прикладная лингвистика; | ||
| Key words in Kazakh | ||
| тілдік модель; морфологиялық күрделі тіл; нейрондық желілер; морфемаларды/сөздерді кірістіру; қолданбалы лингвистика; | ||
| Head of the organization | Мутанов Галимкаир Мутанович | Доктор технических наук / профессор |
| Head of work | Оралбекова Дина Орымбаевна | Phd / нет |
| Native executive in charge | ||