Inventory number IRN Number of state registration
0325РК00296 AP23484329-KC-25 0124РК01082
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 5 Publications Web of science: 2 Publications Scopus: 5
Patents Amount of funding Code of the program
0 42999378.8 AP23484329
Name of work
Разработка интеллектуальной системы на основе NLP и тезауруса военной терминологии для выявления и противодействия информационным операциям в социальных сетях
Type of work Source of funding Report authors
Applied Еримбетова Айгерим Сембековна
0
0
2
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Abbreviated name of the service recipient ИИВТ
Abstract

Комплекс алгоритмов, моделей и программных решений, направленных на автоматизацию извлечения и анализа смысловой информации из военных текстов, а также на интеграцию полученных данных в единую систему знаний.

Әскери мәтіндерден мағыналық ақпаратты автоматты түрде алу мен талдауға, сондай-ақ алынған деректерді бірыңғай білім жүйесіне біріктіруге бағытталған алгоритмдер, үлгілер және бағдарламалық шешімдер кешені.

Дальнейшее развитие и совершенствование компонентов интеллектуальной системы анализа военной информации, включая итерационное улучшение алгоритмов обработки, расширение и оптимизацию тезауруса военной терминологии, применение методов обработки естественного языка для выделения смысловых связей в текстах, а также разработку и тестирование интерфейсов для интеграции системы с социальными сетями.

Әскери ақпаратты талдаудың зияткерлік жүйесінің компоненттерін одан әрі дамыту және жетілдіру, соның ішінде мәтінді өңдеу алгоритмдерін итерациялық жақсарту, әскери терминология тезаурусын кеңейту және оңтайландыру, мәтіндердегі мағыналық байланыстарды айқындау үшін табиғи тілді өңдеу (NLP) әдістерін қолдану, сондай-ақ жүйені әлеуметтік желілермен біріктіруге арналған интерфейстерді әзірлеу және сынақтан өткізу

Методы машинного обучения и глубокого обучения – для итерационного улучшения алгоритмов анализа текстов, классификации и извлечения сущностей, а также оптимизации точности моделей. Методы обработки естественного языка (NLP) – морфологический, синтаксический, семантический анализ, извлечение и связывание терминов, построение эмбеддингов и определение смысловых связей в военных текстах. Методы онтологического моделирования и инженерии знаний – для структурирования и пополнения тезауруса военной терминологии, формализации концептов и связей между ними. Методы системного и семантического анализа – для определения контекста и смысловой нагрузки терминов, выявления закономерностей в корпусах военных текстов. Экспериментальные методы и сравнительный анализ – для проверки эффективности предложенных алгоритмов и интерфейсов на тестовых и реальных данных.

Машиналық оқыту және терең оқыту әдістері –мәтіндерді талдау, сыныптау және мәндік бірліктерді (сущность) шығару алгоритмдерін итерациялық жетілдіру үшін қолдарылды. Табиғи тілді өңдеу (NLP) әдістері –морфологиялық, синтаксистік, семантикалық талдау, терминдерді алу мен байланыстыру, эмбеддингтерді құру және әскери мәтіндердегі мағыналық байланыстарды анықтау үшін қолданылды. Онтологиялық модельдеу және білім инженериясы әдістері – әскери терминология тезаурусын құрылымдау мен толықтыру, концепттер мен олардың арасындағы байланыстарды формализациялау үшін; жүйелік және семантикалық талдау әдістері — терминдердің контексі мен мағыналық жүктемесін айқындау, әскери мәтіндер корпустарындағы заңдылықтарды анықтау үшін; эксперименттік әдістер мен салыстырмалы талдау – ұсынылған алгоритмдер мен интерфейстердің тиімділігін тестілік және нақты деректер негізінде тексеру үшін қолданылды.

Научная новизна работы заключается в интеграции современной методологии построения онтологий и специализированного тезауруса для военных данных, что обеспечивает уникальный уровень точности в анализе текстов и поддержке принятия решений в условиях информационной безопасности

Жұмыстың ғылыми жаңалығы — ақпараттық қауіпсіздік жағдайында мәтіндерді талдау және шешім қабылдау үдерісін қолдау үшін қазіргі онтология құру әдістемесін және әскери деректерге арналған арнайы тезаурусты біріктіру арқылы талдау дәлдігінің жаңа деңгейін қамтамасыз етуінде.

Основные конструктивные и технико-экономические показатели включают повышение точности распознавания и интерпретации военных терминов на 20–30% благодаря специализированному тезаурусу и онтологической модели, сокращение времени анализа текста на 15–25% за счет использования трансформаторных моделей, снижение потребности в вычислительных мощностях на 10–15% при сохранении точности, а также высокую адаптивность системы к новым условиям и терминам, что обеспечивает актуальность и устойчивость. Экономическая эффективность системы проявляется в снижении затрат на анализ информации и повышении качества принимаемых решений, что улучшает соотношение стоимости и эффективности

Негізгі конструктивтік және техника-экономикалық көрсеткіштерге мамандандырылған тезаурус пен онтологиялық модельдің арқасында әскери терминдерді тану және интерпретациялау дәлдігін 20–30%-ға арттыру, трансформаторлық модельдерді қолдану арқылы мәтінді талдау уақытын 15–25%-ға қысқарту, дәлдікті сақтай отырып есептеу ресурстарына қажеттілікті 10–15%-ға азайту, сондай-ақ жүйенің жаңа жағдайлар мен терминдерге жоғары бейімделуін қамтамасыз ету, оның өзектілігі мен тұрақтылығын арттыру жатады. Жүйенің экономикалық тиімділігі ақпаратты талдау шығындарын төмендетіп, қабылданатын шешімдердің сапасын арттыру арқылы шығын мен тиімділік арасындағы арақатынасты жақсартады.

Внедрение результатов проекта находится на стадии разработки, эффективность разработанной системы подтверждена публикацией статей в изданиях, индексируемых в базе данных Scopus, что свидетельствует о признании результатов исследования в научном сообществе.

Жоба нәтижелерін ендіруді іске асыру әзірлену үстінде, ал әзірленген жүйенің тиімділігі Scopus мәліметтер базасында индекстелетін басылымдарда мақалалардың жариялануымен расталады, бұл зерттеу нәтижелерінің ғылыми қауымдастықта мойындалғанын көрсетеді.

Эффективность системы заключается в повышении точности семантического анализа и скорости обработки данных, что позволяет более быстро и точно идентифицировать и классифицировать военные термины и информационные операции. Оптимизация вычислительных ресурсов снижает затраты, а высокая адаптивность системы к новым условиям обеспечивает её устойчивость и актуальность в долгосрочной перспективе.

Жүйенің тиімділігі семантикалық талдау дәлдігін және деректерді өңдеу жылдамдығын арттыруда, бұл әскери терминдер мен ақпараттық операцияларды тез және дәл анықтауға және жіктеуге мүмкіндік береді. Есептеу ресурстарын оңтайландыру шығындарды төмендетеді, ал жүйенің жаңа жағдайларға жоғары бейімделуі оның ұзақ мерзімді тұрақтылығы мен өзектілігін қамтамасыз етеді.

Область применения системы включает анализ военной терминологии, выявление информационных операций и семантическую обработку данных, полученных из социальных сетей. Кроме того, она эффективно используется в сфере кибербезопасности для обнаружения и противодействия информационным угрозам, а также для поддержки принятия решений в военных и правоохранительных структурах.

Жүйенің қолдану аймағы әскери терминологияны талдау, ақпараттық операцияларды анықтау және әлеуметтік желілерден алынған деректерді семантикалық өңдеу болып табылады. Сонымен қатар, ол киберқауіпсіздік саласында ақпараттық қауіптерді анықтау және оларға қарсы әрекет ету, сондай-ақ әскери және құқық қорғау құрылымдарында шешім қабылдауды қолдау үшін тиімді қолданылады.

UDC indices
004.912
International classifier codes
28.23.00; 28.23.29; 28.23.37; 28.23.39;
Key words in Russian
интеллектуальный информационный ресурс; обработка естественного языка (NLP); мультиязычные тезаурусы; извлечение сущностей; языковые модели; мультиязычный семантический словарь; размеченные корпуса текстов; машинное обучение (ML); социальная сеть;
Key words in Kazakh
интеллектуалды ақпараттық ресурс; табиғи тілді өңдеу (NLP); көп тілді тезаурустар; мәнді бөліп алу; тілдік модельдер; көп тілді семантикалық сөздік; белгіленген мәтін корпустары; машиналық оқыту (ML); әлеуметтік желі;
Head of the organization Бектемесов М.А. Доктор физ.-мат. наук / профессор
Head of work Еримбетова Айгерим Сембековна Доктор философии (PhD) / ассоциированный профессор