Inventory number IRN Number of state registration
0324РК01093 AP22787194-KC-24 0124РК00107
Document type Terms of distribution Availability of implementation
Краткие сведения At a negotiated price Number of implementation: 0
Not implemented
Publications
Native publications: 1
International publications: 1 Publications Web of science: 0 Publications Scopus: 0
Patents Amount of funding Code of the program
0 29280709 AP22787194
Name of work
Разработка моделей и методов распознования эмоций в казахоязычных текстах
Type of work Source of funding Report authors
Fundamental Ергеш Бану Жантуғанқызы
2
0
2
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Некоммерческое акционерное общество "Евразийский Национальный университет имени Л.Н. Гумилева"
Abbreviated name of the service recipient НАО "ЕНУ им.Л.Н.Гумилева"
Abstract

тексты на казахском языке, модели и методы обработки естественного языка

қазақ тіліндегі мәтіндер, табиғи тілді өңдеу модельдері мен әдістері

Разработка моделей и методов распознавания эмоций в казахскоязычных текстах для определения настроения пользователей в социальных сетях

Әлеуметтік желілердегі қолданушылардың көңіл-күйін анықтау үшін қазақтілді мәтіндердегі эмоцияны тану модельдері мен әдістерін әзірлеу

Сбор и анализ текстовых данных из социальных сетей и других источников для создания базы знаний с эмоционально окрашенными словами и словосочетаниями, методы обработки естественного языка.

Эмоционалды реңкі бар сөздер мен сөз тіркестерімен білім базасын құру үшін әлеуметтік желілерден және басқа ақпарат көздерден мәтіндік деректерді жинау және талдау, табиғи тілді өңдеу әдістері.

База семантических знаний эмоциональных слов и фраз в казахском языке, корпус эмоциональных текстов. Новизна полученных результатов заключается в том, что впервые создана семантическая база знаний и корпус эмоциональных текстов для казахского языка. Они учитывают уникальные лингвистические особенности казахского языка, что значительно улучшает точность анализа эмоций в текстах. Эти ресурсы открывают возможности для применения в анализе социальных настроений и созданий приложений, поддерживая развитие технологий искусственного интеллекта для казахского языка.

Қазақ тіліндегі эмоционалды сөздердің және сөз тіркестердің семантикалық білімдер базасы, эмоциялық мәтіндер корпусы. Алынған нәтижелерддің жаңалығы алғаш рет қазақ тіліне арналған білімнің семантикалық базасы мен эмоционалды мәтіндер корпусының құрылуымен негізделеді. Оларды құруда қазақ тілінің бірегей лингвистикалық ерекшеліктерін ескерілді, бұл мәтіндердегі эмоцияларды анықтау дәлдігін айтарлықтай жақсартады. Құрылған ресурстар қазақ тілі үшін жасанды интеллект технологияларын дамытуды қолдай отырып, әлеуметтік көңіл-күй талдауда және қосымшалар құруда қолдануға мүмкіндік береді.

Разработана семантическая база знаний эмоциональных слов и фраз, включающая разметку текстов с учётом лексических и семантических особенностей казахского языка. Создан корпус эмоциональных текстов на казахском языке, обеспечивающий основу для тестирования и обучения моделей распознавания эмоций. В проекте задействованы 4 PhD, из них 3 PhD по специальности Информатика, 1 PhD по специальности «6D011700-Казахский язык и литература», 2 докторанта, 1 инженер-программист и другие специалисты имеющие заделы на теме проекта.

Қазақ тілінің лексикалық және семантикалық ерекшеліктерін ескере отырып, мәтіндерді белгілеуді қамтитын эмоционалды сөздер мен сөз тіркестерін білудің семантикалық базасы жасалды. Эмоцияны тану модельдерін тестілеу мен оқытуға негіз болатын қазақ тіліндегі эмоциялық мәтіндер корпусы құрылды. Жобаға 4 PhD, оның ішінде Информатика мамандығы бойынша 3 PhD, "6D011700-Қазақ тілі мен әдебиеті" мамандығы бойынша 1 PhD, 2 докторант, 1 инженер-программист және жоба тақырыбына қатысы бар басқа да мамандар қатысады.

Не требует внедрения.

Енгізуді қажет етпейді.

Эффективность проекта заключается в создании уникальной семантической базы знаний и корпуса эмоциональных текстов для казахского языка, что расширяет возможности анализа текстов на казахском языке и разработки технологий обработки естественного языка. Направление научного проекта является современным глобальным трендом научных исследований в мире и привлекает к этому исследованию молодых ученых, что дает толчок их дальнейшему развитию и профессиональному росту.

Жобаның тиімділігі қазақ тіліндегі мәтіндерді талдау және табиғи тілді өңдеу технологияларын әзірлеу мүмкіндіктерін арттыратын қазақ тілі үшін бірегей семантикалық білім базасын және эмоционалды мәтіндер корпусын құру болып табылады. Ғылыми жобаның бағыты әлемдегі ғылыми зерттеулердің заманауи жаһандық тренд болып табылады және осы зерттеуге жас ғалымдардың қызығушылығын арттырып, олардың одан әрі дамуына және кәсіби өсуіне серпін береді.

Инженерия и технологии, цифровые технологии, искусственный интеллект, в том числе в системах обработки естественного языка, могут использоваться в качестве инструмента для анализа настроений, эмоций в обществе.

Инженерия және технология, цифрлық технологиялар, жасанды интеллект, оның ішінде табиғи тілді өңдеу жүйлерінде қоғамдағы көңіл-күйді, эмоцияларын талдау құралы ретінде қолданыла алады.

UDC indices
004.8, 81'322
International classifier codes
16.31.21; 28.23.02;
Key words in Russian
искусственный интеллект; обработка естественного языка; обработка казахского языка; распознавание эмоций; сентимент анализ; машинное обучение;
Key words in Kazakh
жасанды интеллект; табиғи тілді өңдеу; қазақ тілін өңдеу; эмоцияны тану; сентимент талдау; машиналық оқыту;
Head of the organization Сыдыков Ерлан Батташевич доктор исторических наук / Профессор
Head of work Ергеш Бану Жантуғанқызы Phd / -