Inventory number IRN Number of state registration
0225РК00689 AP19679847-OT-25 0123РК00362
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 1
International publications: 4 Publications Web of science: 0 Publications Scopus: 1
Number of books Appendicies Sources
1 3 36
Total number of pages Patents Illustrations
141 0 61
Amount of funding Code of the program Table
35797548.96 AP19679847 5
Name of work
Разработка методов анализа казахского политического дискурса
Report title
Type of work Source of funding The product offerred for implementation
Applied Технология
Report authors
Бекманова Гульмира Тылеубердиевна , Шәріпбай Алтынбек Әмірұлы , Разахова Бибигул Шамшановна , Ергеш Бану Жантуғанқызы , Муканова Асель Сериковна , Жеткенбай Лена , Зулхажав Алтанбек , Елибаева Газиза Казбековна , Сайранбекова Аяулым Данияровна , Орынбай Лаура Орынбайқызы , Сарсенбаев Саулет Майрамбекулы ,
2
0
2
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Некоммерческое акционерное общество "Евразийский Национальный университет имени Л.Н. Гумилева"
Abbreviated name of the service recipient НАО "ЕНУ им.Л.Н.Гумилева"
Abstract

Объект исследования – казахский язык, его тексты и речевые акты в политическом дискурсе.

Зерттеу нысаны – қазақ тіліндегі саяси дискурс, оның мәтіндері мен сөйлеу актілері.

Цель работы – разработка методов анализа политического дискурса в социальных сетях на казахском языке для выявления официальных и неофициальных источников информации и определения настроений обсуждений в этих источниках.

Жұмыстың мақсаты – әлеуметтік желілер мен ақпараттық ресурстардағы қазақ тіліндегі саяси дискурсты талдау әдістерін әзірлеу, ресми және бейресми ақпарат көздерін анықтау және олардағы пікірталас көңіл-күйін автоматты түрде бағалау.

Методология исследования основана на интеграции лингвистических и искусственно-интеллектуальных подходов. Использовались методы графематического, морфологического и синтаксического анализа, онтологического моделирования, построения семантических баз знаний и анализа тональности (сентимент-анализа). Разработаны программные модули на языках Python и Java с использованием технологий Flask и Vue.js.

Жоба барысында лингвистика мен жасанды интеллект әдістері үйлестіріліп, табиғи тілді өңдеу (NLP) технологиялары қолданылды. Негізгі әдістер қатарына графематикалық, морфологиялық және синтаксистік талдау, онтологиялық модельдеу, семантикалық база құру және сентимент-анализ жатады. Python және Java тілдері мен Flask, Vue.js негізінде бағдарламалық модульдер жасалды.

В результате исследования получены комплексные решения по трем основным направлениям: 1. создание текстового корпуса казахского политического дискурса объемом более 300 000 слов по темам «Предвыборная реклама», «Речь политических деятелей» и «Предвыборные дебаты»; 2. разработку онтологических моделей и семантических баз знаний по указанным темам; 3. создание интеллектуального процессора с функцией синонимайзера и сентимент-анализатора для автоматической обработки казахских политических текстов. Научная новизна состоит в том, что впервые создана комплексная система анализа политического дискурса на казахском языке, охватывающая все этапы обработки — от корпуса до автоматической интерпретации.

Зерттеу нәтижесінде үш негізгі бағытта кешенді шешімдер алынды: 1. «Сайлауалды жарнама», «Саяси қайраткерлердің сөзі» және «Сайлауалды пікірсайыстар» тақырыптары бойынша 300 000 сөзден тұратын мәтіндік корпус құрылды; 2. осы тақырыптарда онтологиялық модельдер және білім базалары әзірленді; 3. қазақ тіліндегі мәтіндердің эмоциялық реңкін автоматты бағалайтын сентимент-анализатор және синонимайзер функциясы бар процессор жасалды. Жаңалығы – алғаш рет қазақ тіліндегі саяси дискурсты автоматты талдаудың толық циклін (мәтіндік корпус, онтология, семантикалық база, анализаторлар) қамтитын интеллектуалды жүйе құрылды.

Техническо-экономическая эффективность не оценивалась, однако ожидается значительный социальный эффект, выражающийся в повышении цифрового статуса государственного языка, развитии национальных ИТ-ресурсов и поддержке концепции «Слышащего государства».

Техникалық-экономикалық тиімділік бұл кезеңде сандық түрде бағаланған жоқ, алайда зерттеу нәтижелері мемлекеттік тілдің цифрлық әлеуетін арттыруға, ұлттық ақпараттық кеңістіктің сапасын жақсартуға және «тыңдайтын мемлекет» тұжырымдамасын іске асыруға ықпал етеді.

В рамках проекта Сайранбекова Аяулым Данияркызы, докторант третьего курса образовательной программы «8D06102 – Информатика» факультета информационных технологий Евразийского национального университета имени Л.Н. Гумилева, выполняет докторскую диссертацию. Тема исследования – «Методы сентимент анализа политических текстов в сети Интернет». Данная тема утверждена приказом университета № 2384–П от 14 ноября 2023 года (https://smart.enu.kz/api/serve?path=/general/files/22e60b0e-a9d5-4714-a9ea-4ff5bb1a38b4.pdf).

Жоба аясында Л.Н. Гумилев атындағы Еуразия ұлттық университетін Ақпараттық технологиялар факультетінің «8D06102 – Информатика» білім беру бағдарламасы бойынша үшінші курс докторанты Сайранбекова Аяулым Даниярқызы докторлық диссертация жазу үстінде. Зерттеу жұмысының тақырыбы – «Интернет желісіндегі саяси мәтіндерді сентимент талдау әдістері». Бұл тақырып университеттің 2023 жылғы 14 қарашадағы №2384–П бұйрығымен бекітілген (https://smart.enu.kz/api/serve?path=/general/files/22e60b0e-a9d5-4714-a9ea-4ff5bb1a38b4.pdf).

Результаты исследования обладают высокой научной и практической значимостью. Разработанные методы и модели позволяют анализировать эмоциональные и оценочные характеристики политических текстов в интернет-пространстве. Эти результаты могут быть использованы при разработке интеллектуальных приложений и информационно-аналитических систем. Кроме того, предложенные подходы и инструменты могут применяться в деятельности Министерства искусственного интеллекта и цифрового развития Республики Казахстан, в частности для совершенствования цифровых коммуникаций, мониторинга общественного мнения и систем автоматической оценки контента.

Зерттеу нәтижелері жоғары ғылыми және практикалық маңызға ие. Зерттеу жұмыс барысында алынған әдістер мен модельдер интернет кеңістігіндегі саяси мәтіндердің эмоционалды және бағалау сипатын талдауға мүмкіндік береді. Бұл нәтижелерді интеллектуалды қолданбалар мен ақпараттық-талдау жүйелерін әзірлеуде қолдануға болады. Сонымен қатар, әзірленген тәсілдер мен құралдар Қазақстан Республикасының Жасанды интеллект және цифрлық даму министрлігінің қызметінде, атап айтқанда цифрлық коммуникацияларды, қоғамдық пікір мониторингін және контентті автоматты бағалау жүйелерін жетілдіруде пайдалануға мүмкіндік береді.

Результаты имеют прикладное значение для образования, языковых приложений, мониторинга государственных коммуникаций и анализа общественных настроений.

Нәтижелерді қолдану салаларына білім беру жүйелері, тілдік оқыту және бағалау платформалары, мемлекеттік коммуникация мониторингі, әлеуметтік медиа талдауы мен ақпараттық қауіпсіздік кіреді.

UDC indices
004.8:81'33
International classifier codes
16.31.00; 28.23.39;
Readiness of the development for implementation
Key words in Russian
политический дискурс; анализ потока контента; социальные сети; сентимент анализ; анализ настроений;
Key words in Kazakh
саяси дискурс; мазмұн ағынын талдау; әлеуметтік желілер; сентимент талдау; көңіл-күйді талдау;
Head of the organization Сыдыков Ерлан Батташевич доктор исторических наук / Профессор
Head of work Бекманова Гульмира Тылеубердиевна Кандидат технических наук, PhD / ассоциированный профессор
Native executive in charge