Inventory number IRN Number of state registration
0324РК01393 AP23484329-KC-24 0124РК01082
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 2 Publications Web of science: 0 Publications Scopus: 2
Patents Amount of funding Code of the program
0 33998453.2 AP23484329
Name of work
Разработка интеллектуальной системы на основе NLP и тезауруса военной терминологии для выявления и противодействия информационным операциям в социальных сетях
Type of work Source of funding Report authors
Applied Еримбетова Айгерим Сембековна
0
0
2
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Abbreviated name of the service recipient ИИВТ
Abstract

Информационные операции в социальных сетях

Әлеуметтік желілердегі ақпараттық операциялар

Целью проекта является разработка интеллектуальной системы, основанной на обработке естественного языка (Natural Language Processing, NLP) и тезаурусе военной терминологии, с целью выявления, анализа и противодействия информационным операциям в социальных сетях.

Жобаның мақсаты – әлеуметтік желілердегі ақпараттық операцияларды анықтау, талдау және оларға қарсы тұру үшін табиғи тілді өңдеуге (NLP) және әскери терминологияның тезаурусына негізделген интеллектуалды жүйені дамыту.

В рамках проекта будут применены инновационные методы. Важно постоянно оценивать характеристики в течение и после завершения проекта для адекватной оценки его влияния и эффективности. Методы исследования включают анализ литературных источников и систематизацию данных для определения актуальных подходов в NLP, использование методологии построения онтологий (MOBM) для структурирования военной терминологии, семантический анализ текста с помощью алгоритмов токенизации и трансформаторных моделей, автоматическое аннотирование и классификацию данных (MEGAnno+), сравнительный анализ моделей NLP (BERT, RoBERTa, GPT-4, LLaMA) и количественный анализ данных из социальных сетей для выявления информационных операций.

Жобада инновациялық әдістер қолданылады. Оның әсері мен тиімділігін барабар бағалау үшін жобаны аяқтау кезінде және аяқталғаннан кейін өнімділікті үздіксіз бағалау маңызды. Зерттеу әдістері NLP саласындағы өзекті тәсілдерді анықтау үшін әдеби көздер мен мәліметтерді жүйелеуді, әскери терминологияны құрылымдау үшін онтология құру әдістемесін (MOBM) қолдануды, мәтінді токенизация және трансформаторлық модельдер арқылы семантикалық талдауды, мәліметтерді автоматты түрде аннотациялау және жіктеуді (MEGAnno+), NLP модельдерінің салыстырмалы талдауын (BERT, RoBERTa, GPT-4, LLaMA) және әлеуметтік желілердегі ақпараттық операцияларды анықтау үшін деректердің сандық талдауын қамтиды.

Научная новизна работы заключается в интеграции современной методологии построения онтологий и специализированного тезауруса для военных данных, что обеспечивает уникальный уровень точности в анализе текстов и поддержке принятия решений в условиях информационной безопасности.

Жұмыстың ғылыми жаңалығы — ақпараттық қауіпсіздік жағдайында мәтіндерді талдау және шешім қабылдау үдерісін қолдау үшін қазіргі онтология құру әдістемесін және әскери деректерге арналған арнайы тезаурусты біріктіру арқылы талдау дәлдігінің жаңа деңгейін қамтамасыз етуінде.

Основные конструктивные и технико-экономические показатели включают повышение точности распознавания и интерпретации военных терминов на 20–30% благодаря специализированному тезаурусу и онтологической модели, сокращение времени анализа текста на 15–25% за счет использования трансформаторных моделей, снижение потребности в вычислительных мощностях на 10–15% при сохранении точности, а также высокую адаптивность системы к новым условиям и терминам, что обеспечивает актуальность и устойчивость. Экономическая эффективность системы проявляется в снижении затрат на анализ информации и повышении качества принимаемых решений, что улучшает соотношение стоимости и эффективности.

Негізгі конструктивтік және техника-экономикалық көрсеткіштерге мамандандырылған тезаурус пен онтологиялық модельдің арқасында әскери терминдерді тану және интерпретациялау дәлдігін 20–30%-ға арттыру, трансформаторлық модельдерді қолдану арқылы мәтінді талдау уақытын 15–25%-ға қысқарту, дәлдікті сақтай отырып есептеу ресурстарына қажеттілікті 10–15%-ға азайту, сондай-ақ жүйенің жаңа жағдайлар мен терминдерге жоғары бейімделуін қамтамасыз ету, оның өзектілігі мен тұрақтылығын арттыру жатады. Жүйенің экономикалық тиімділігі ақпаратты талдау шығындарын төмендетіп, қабылданатын шешімдердің сапасын арттыру арқылы шығын мен тиімділік арасындағы арақатынасты жақсартады.

Внедрение результатов проекта находится на стадии разработки, получено авторское свидетельство, что подтверждает эффективность системы и признание её в качестве объекта интеллектуальной собственности.

Жоба нәтижелерін ендіруді іске асыру әзірлену үстінде, жобаның жүзеге асырылу дәрежесі жоғары, авторлық құқық сертификаты алынды, бұл жүйенің тиімділігін және интеллектуалдық меншік ретінде танылғандығын растайды.

Эффективность системы заключается в повышении точности семантического анализа и скорости обработки данных, что позволяет более быстро и точно идентифицировать и классифицировать военные термины и информационные операции. Оптимизация вычислительных ресурсов снижает затраты, а высокая адаптивность системы к новым условиям обеспечивает её устойчивость и актуальность в долгосрочной перспективе.

Жүйенің тиімділігі семантикалық талдау дәлдігін және деректерді өңдеу жылдамдығын арттыруда, бұл әскери терминдер мен ақпараттық операцияларды тез және дәл анықтауға және жіктеуге мүмкіндік береді. Есептеу ресурстарын оңтайландыру шығындарды төмендетеді, ал жүйенің жаңа жағдайларға жоғары бейімделуі оның ұзақ мерзімді тұрақтылығы мен өзектілігін қамтамасыз етеді.

Область применения системы включает анализ военной терминологии, выявление информационных операций и семантическую обработку данных, полученных из социальных сетей. Кроме того, она эффективно используется в сфере кибербезопасности для обнаружения и противодействия информационным угрозам, а также для поддержки принятия решений в военных и правоохранительных структурах.

Жүйенің қолдану аймағы әскери терминологияны талдау, ақпараттық операцияларды анықтау және әлеуметтік желілерден алынған деректерді семантикалық өңдеу болып табылады. Сонымен қатар, ол киберқауіпсіздік саласында ақпараттық қауіптерді анықтау және оларға қарсы әрекет ету, сондай-ақ әскери және құқық қорғау құрылымдарында шешім қабылдауды қолдау үшін тиімді қолданылады.

UDC indices
004.912
International classifier codes
28.23.00; 28.23.29; 28.23.37; 28.23.39;
Key words in Russian
интеллектуальный информационный ресурс; обработка естественного языка (NLP); мультиязычные тезаурусы; извлечение сущностей; языковые модели; мультиязычный семантический словарь; размеченные корпуса текстов; машинное обучение (ML); социальная сеть;
Key words in Kazakh
интеллектуалды ақпараттық ресурс; табиғи тілді өңдеу (NLP); көп тілді тезаурустар; мәнді бөліп алу; тілдік модельдер; көп тілді семантикалық сөздік; белгіленген мәтін корпустары; машиналық оқыту (ML); әлеуметтік желі;
Head of the organization Мутанов Галимкаир Доктор технических наук / профессор
Head of work Еримбетова Айгерим Сембековна Доктор философии (PhD) / ассоциированный профессор