Inventory number IRN Number of state registration
0225РК00671 AP19676342-OT-25 0123РК00816
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 1
International publications: 4 Publications Web of science: 2 Publications Scopus: 4
Number of books Appendicies Sources
1 4 33
Total number of pages Patents Illustrations
366 0 93
Amount of funding Code of the program Table
34471451.5 AP19676342 25
Name of work
Мультиклассификация идеологических направлений кибер экстремизма на казахском языке методами искусственного интеллекта
Report title
Type of work Source of funding The product offerred for implementation
Applied Модель
Report authors
Мусиралиева Шынар Женисбековна , Болатбек Милана Асланбекқызы , Байсылбаева Кымбат Данияровна , Медетбек Жанар Бахытжанқызы , Бекетова Айман Кайырбековна , Нарбаева Салтанат Муратбековна , Мусиралиева Жанна Женисбековна , Елтай Жастай , Аетова Багдат Алтынбековна , Абайұлы Ерұлан , Жиенбаев Куаныш ,
1
0
3
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Некоммерческое акционерное общество "Казахский национальный университет имени аль-Фараби"
Abbreviated name of the service recipient НАО "КазНУ им. аль-Фараби"
Abstract

Определение веб-контента, связанного с идеологией (радикализация, вербовка (рекрутмент) и пропаганда) киберэкстремизма

Киберэкстремизмнің идеологиялық бағыттарына (радикализация, рекрутмент, пропаганда) байланысты веб-контентті анықтау

Цель проекта – изучение распространения деструктивной киберпропаганды в социальных сетях и мессенджерах с применением методов искусственного интеллекта; создание моделей мультиклассификации текстовых, аудио– и видеопубликаций экстремистского содержания по идеологическим направлениям; разработка методов определения наиболее активной киберпропаганды и сообществ

Жобаның мақсаты – әлеуметтік желілерде және мессенджерлерде жасанды интеллект әдістері көмегімен деструктивті сипаттағы кибер насихаттың таралуын зерттеу, мәтіндік, аудио және бейне жарияланымдарында экстремистік мазмұнның идеологиялық бағыттарындағы мультиклассификациялау модельдерін құру және ең белсенді кибернасихаттауды және қауымдастықтарды анықтаудың әдістерін құру.

Методы машинного и глубокого обучения, методы классификации текстов, методы обработки естественного языка (NLP), нейронные сети, методы анализа социальных сетей, статистические методы обработки данных, методы системного анализа.

Машиналық және терең оқыту әдістері, мәтінді жіктеу әдістері, табиғи тілді өңдеу әдістері (NLP), нейрондық желілер, әлеуметтік желілерді талдау әдістері, деректерді өңдеудің статистикалық әдістері, жүйелік талдау әдістері.

Создан корпус мультиклассификации экстремистских и идеологических текстов. Для каждого класса составлены списки ключевых слов, правила и перечень групп для сбора данных. Впервые создан объемный датасет мультимедиа контента идеологического направления с процедурой аннотации. Аналога в открытом доступе нет. Создана модель мультиклассификации идеологического направления в социальных сетях и мессенджерах (пропаганда деструктивных религиозных течений, радикализация и вербовка в экстремистские и террористические организации) отличающаяся высокой точностью. Создана модель мультиклассификации экстремистского содержания в текстовых, аудио, видео публикациях (религиозный экстремизм, политический экстремизм, ксенофобия). Наибольший весовой коэффициент принадлежит тексту, а также разработана процедура выбора весовых коэффициентов для мультимедийного контента идеологического направлений. Разработана гибридная модель для выявления наиболее активной киберпропаганды в социальных сетях и мессенджерах. Разработаны алгоритмы и методы обнаружения сообществ по заданному набору признаков. Разработаны новые метрики анализа социальных сетей позволяющих учитывать семантическую и эмоциональную составляющую сообщений, частоту пересылки и обработки контента др. Таким образом создана гибридная модель, учитывающая не только текстовую часть, но и другие метаданные. Разработано программное обеспечение.

Экстремистік және идеологиялық мазмұндағы мәтіндердің мультиклассификация корпусы жасалды. Әрбір класс үшін кілттік сөздердің тізімі, ережелер және деректерді жинауға арналған топтар тізбесі әзірленді. Алғаш рет идеологиялық бағыттағы мультимедиа контентінің кең ауқымды аннотацияланған датасет құрылды. Ашық қолжетімділікте балама жоқ. Әлеуметтік желілер мен мессенджерлерде идеологиялық бағыттағы (деструктивті діни ағымдарды насихаттау, радикалдандыру және экстремистік пен террористік ұйымдарға тарту) контентті мультиклассификациялауға арналған жоғары дәлдіктегі модель жасалды. Мәтіндік, аудио және бейне жарияланымдардағы (діни экстремизм, саяси экстремизм, ксенофобия) экстремистік мазмұнды мультиклассификациялау моделі құрылды. Ең жоғары салмақ коэффициенті мәтіндік компонентке берілді, идеологиялық бағыттағы мультимедиялық контенттің салмақ коэффициенттерін таңдау процедурасы әзірленді. Әлеуметтік желілер мен мессенджерлердегі ең белсенді кибернасихатты анықтауға арналған гибридті модель жасалды. Белгілер жиынтығына сәйкес қауымдастықтарды анықтау алгоритмдері мен әдістері әзірленді. Әлеуметтік желілерді талдаудың жаңа метрикалары ұсынылды, олар хабарламалардың семантикалық және эмоционалдық құрамын, контенттің тарату және өңделу жиілігін және басқа параметрлерді ескеруге мүмкіндік береді. Осылайша тек мәтіндік бөлікті ғана емес, метадеректерді қамтитын гибридті модель жасалды. Бағдарламалық жабдықтама әзірленді.

Разработан программный прототип системы, потенциальное снижение трудозатрат на анализ контента — до 40 %.

Бағдарламалық жүйенің прототипі әзірленді, контентті талдау бойынша еңбек шығындарын 40 %-ға дейін қысқарту күтілуде.

не внедрено

ендірілмеген

Эффективность проекта, направленной на определение идеологии киберэкстремизма, подтверждается достигнутыми результатами, отражающими научную новизну, завершённость поставленных задач и практическую значимость полученных данных. В ходе исследования были получены новые знания о лингвистических, психоэмоциональных и идеологических особенностях киберэкстремистских сообщений на казахском языке. Разработана интеллектуальная система анализа текстов, основанная на методах машинного обучения , что позволило повысить точность и глубину идентификации деструктивных и идеологически мотивированных сообщений. Результаты исследования нашли отражение в публикациях высокорейтинговых журналах индексируемых в базах Scopus и WoS, а также были представлены на международных и республиканских конференциях и научных семинарах. В процессе реализации проекта зарегистрированы объекты интеллектуальной собственности, включая авторские свидетельства на разработанные алгоритмы и программное обеспечение для анализа идеологического контента. Работа способствовала повышению научной квалификации участников исследовательской группы и укреплению их компетенций в области кибербезопасности и лингвистического анализа. Проведённое исследование вносит значимый вклад в развитие научных основ противодействия киберэкстремизму и формирование национальной системы анализа и мониторинга идеологически опасного контента в киберпространстве, что подтверждает его научную и практическую ценность.

Киберэкстремизм идеологиясын анықтауға бағытталған жобаның тиімділігі ғылыми жаңалықты, қойылған міндеттердің толықтығын және алынған деректердің практикалық маңыздылығын көрсететін қол жеткізілген нәтижелермен расталады. Зерттеу барысында қазақ тіліндегі киберэкстремистік хабарламалардың лингвистикалық, психоэмоционалдық және идеологиялық ерекшеліктері туралы жаңа білім алынды. Машиналық оқыту әдістеріне негізделген мәтінді талдаудың интеллектуалды жүйесі жасалды, бұл деструктивті және идеологиялық тұрғыдан негізделген хабарламаларды анықтаудың дәлдігі мен тереңдігін арттыруға мүмкіндік берді. Зерттеу нәтижелері Scopus және WoS базаларында индекстелетін жоғары рейтингті журналдарда жарияланымдарда көрініс тапты, сондай-ақ халықаралық және республикалық конференциялар мен ғылыми семинарларда ұсынылды. Жобаны іске асыру барысында зияткерлік меншік объектілері, соның ішінде әзірленген алгоритмдерге авторлық куәліктер және идеологиялық мазмұнды талдауға арналған бағдарламалық қамтамасыз ету тіркелген. Жұмыс зерттеу тобына қатысушылардың ғылыми біліктілігін арттыруға және олардың киберқауіпсіздік және лингвистикалық талдау саласындағы құзыреттерін нығайтуға ықпал етеді. Жүргізілген зерттеу киберэкстремизмге қарсы іс-қимылдың ғылыми негіздерін дамытуға және киберкеңістікте идеологиялық қауіпті мазмұнды талдау мен мониторингтеудің ұлттық жүйесін қалыптастыруға елеулі үлес қосты, бұл оның ғылыми және практикалық құндылығын растайды.

Практические методики, алгоритмы и прикладные решения могут применяться органами, обеспечивающими информационную безопасность, защиту критической инфраструктуры и борьбу с интернет–экстремизмом.

Алынған нәтижелердің мақсатты тұтынушылары – іргелі нәтижелерді әлемдік ғылыми қауымдастық пайдалана алады, әдіснама, алгоритмдер, қолданбалы нәтижелерді ақпараттық қауіпсіздікті, сыни инфрақұрылымды қамтамасыз ету, интернет–экстремизммен күрес жөніндегі уәкілетті органдар пайдалануы мүмкін.

UDC indices
004.056
International classifier codes
81.96.00;
Readiness of the development for implementation
Key words in Russian
информационная безопасность; экстремизм; социальные сети; методы машинного обучения; деструктивный контент; вычислительная лингвистика; глубокое обучение;
Key words in Kazakh
ақпараттық қауіпсіздік; экстремизм; әлеуметтік желілер; машиналық оқыту әдістері; деструктивті контент; есептеу лингвистикасы; терең оқыту;
Head of the organization Ибраимов Маргулан Касенович PhD / ассоциированный профессор
Head of work Мусиралиева Шынар Женисбековна Кандидат физико-математических наук / профессор по научному направлению Компьютерные науки и информатика
Native executive in charge Болатбек Милана Асланбекқызы и.о.доцента