Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0324РК01093 | AP22787194-KC-24 | 0124РК00107 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | At a negotiated price | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 1 | ||||
International publications: 1 | Publications Web of science: 0 | Publications Scopus: 0 | ||
Patents | Amount of funding | Code of the program | ||
0 | 29280709 | AP22787194 | ||
Name of work | ||||
Разработка моделей и методов распознования эмоций в казахоязычных текстах | ||||
Type of work | Source of funding | Report authors | ||
Fundamental | Ергеш Бану Жантуғанқызы | |||
2
0
2
0
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | МНВО РК | |||
Full name of the service recipient | ||||
Некоммерческое акционерное общество "Евразийский Национальный университет имени Л.Н. Гумилева" | ||||
Abbreviated name of the service recipient | НАО "ЕНУ им.Л.Н.Гумилева" | |||
Abstract | ||||
тексты на казахском языке, модели и методы обработки естественного языка қазақ тіліндегі мәтіндер, табиғи тілді өңдеу модельдері мен әдістері Разработка моделей и методов распознавания эмоций в казахскоязычных текстах для определения настроения пользователей в социальных сетях Әлеуметтік желілердегі қолданушылардың көңіл-күйін анықтау үшін қазақтілді мәтіндердегі эмоцияны тану модельдері мен әдістерін әзірлеу Сбор и анализ текстовых данных из социальных сетей и других источников для создания базы знаний с эмоционально окрашенными словами и словосочетаниями, методы обработки естественного языка. Эмоционалды реңкі бар сөздер мен сөз тіркестерімен білім базасын құру үшін әлеуметтік желілерден және басқа ақпарат көздерден мәтіндік деректерді жинау және талдау, табиғи тілді өңдеу әдістері. База семантических знаний эмоциональных слов и фраз в казахском языке, корпус эмоциональных текстов. Новизна полученных результатов заключается в том, что впервые создана семантическая база знаний и корпус эмоциональных текстов для казахского языка. Они учитывают уникальные лингвистические особенности казахского языка, что значительно улучшает точность анализа эмоций в текстах. Эти ресурсы открывают возможности для применения в анализе социальных настроений и созданий приложений, поддерживая развитие технологий искусственного интеллекта для казахского языка. Қазақ тіліндегі эмоционалды сөздердің және сөз тіркестердің семантикалық білімдер базасы, эмоциялық мәтіндер корпусы. Алынған нәтижелерддің жаңалығы алғаш рет қазақ тіліне арналған білімнің семантикалық базасы мен эмоционалды мәтіндер корпусының құрылуымен негізделеді. Оларды құруда қазақ тілінің бірегей лингвистикалық ерекшеліктерін ескерілді, бұл мәтіндердегі эмоцияларды анықтау дәлдігін айтарлықтай жақсартады. Құрылған ресурстар қазақ тілі үшін жасанды интеллект технологияларын дамытуды қолдай отырып, әлеуметтік көңіл-күй талдауда және қосымшалар құруда қолдануға мүмкіндік береді. Разработана семантическая база знаний эмоциональных слов и фраз, включающая разметку текстов с учётом лексических и семантических особенностей казахского языка. Создан корпус эмоциональных текстов на казахском языке, обеспечивающий основу для тестирования и обучения моделей распознавания эмоций. В проекте задействованы 4 PhD, из них 3 PhD по специальности Информатика, 1 PhD по специальности «6D011700-Казахский язык и литература», 2 докторанта, 1 инженер-программист и другие специалисты имеющие заделы на теме проекта. Қазақ тілінің лексикалық және семантикалық ерекшеліктерін ескере отырып, мәтіндерді белгілеуді қамтитын эмоционалды сөздер мен сөз тіркестерін білудің семантикалық базасы жасалды. Эмоцияны тану модельдерін тестілеу мен оқытуға негіз болатын қазақ тіліндегі эмоциялық мәтіндер корпусы құрылды. Жобаға 4 PhD, оның ішінде Информатика мамандығы бойынша 3 PhD, "6D011700-Қазақ тілі мен әдебиеті" мамандығы бойынша 1 PhD, 2 докторант, 1 инженер-программист және жоба тақырыбына қатысы бар басқа да мамандар қатысады. Не требует внедрения. Енгізуді қажет етпейді. Эффективность проекта заключается в создании уникальной семантической базы знаний и корпуса эмоциональных текстов для казахского языка, что расширяет возможности анализа текстов на казахском языке и разработки технологий обработки естественного языка. Направление научного проекта является современным глобальным трендом научных исследований в мире и привлекает к этому исследованию молодых ученых, что дает толчок их дальнейшему развитию и профессиональному росту. Жобаның тиімділігі қазақ тіліндегі мәтіндерді талдау және табиғи тілді өңдеу технологияларын әзірлеу мүмкіндіктерін арттыратын қазақ тілі үшін бірегей семантикалық білім базасын және эмоционалды мәтіндер корпусын құру болып табылады. Ғылыми жобаның бағыты әлемдегі ғылыми зерттеулердің заманауи жаһандық тренд болып табылады және осы зерттеуге жас ғалымдардың қызығушылығын арттырып, олардың одан әрі дамуына және кәсіби өсуіне серпін береді. Инженерия и технологии, цифровые технологии, искусственный интеллект, в том числе в системах обработки естественного языка, могут использоваться в качестве инструмента для анализа настроений, эмоций в обществе. Инженерия және технология, цифрлық технологиялар, жасанды интеллект, оның ішінде табиғи тілді өңдеу жүйлерінде қоғамдағы көңіл-күйді, эмоцияларын талдау құралы ретінде қолданыла алады. |
||||
UDC indices | ||||
004.8, 81'322 | ||||
International classifier codes | ||||
16.31.21; 28.23.02; | ||||
Key words in Russian | ||||
искусственный интеллект; обработка естественного языка; обработка казахского языка; распознавание эмоций; сентимент анализ; машинное обучение; | ||||
Key words in Kazakh | ||||
жасанды интеллект; табиғи тілді өңдеу; қазақ тілін өңдеу; эмоцияны тану; сентимент талдау; машиналық оқыту; | ||||
Head of the organization | Сыдыков Ерлан Батташевич | доктор исторических наук / Профессор | ||
Head of work | Ергеш Бану Жантуғанқызы | Phd / - |