| Inventory number | IRN | Number of state registration |
|---|---|---|
| 0225РК00151 | AP19576825-OT-25 | 0123РК00208 |
| Document type | Terms of distribution | Availability of implementation |
| Заключительный | Gratis | Number of implementation: 1 Implemented |
| Publications | ||
| Native publications: 1 | ||
| International publications: 2 | Publications Web of science: 0 | Publications Scopus: 2 |
| Number of books | Appendicies | Sources |
| 1 | 7 | 95 |
| Total number of pages | Patents | Illustrations |
| 136 | 1 | 38 |
| Amount of funding | Code of the program | Table |
| 24999547.4 | AP19576825 | 20 |
| Name of work | ||
| Разработка методов и алгоритмов машинного обучения для выявления финансирования террористической деятельности в Республике Казахстан | ||
| Report title | ||
| Type of work | Source of funding | The product offerred for implementation |
| Applied | Метод, способ | |
| Report authors | ||
| Болшибаева Айгерим Какимжановна , Рахметулаева Сабина Батырхановна , Муратжан Зарина , Кулбаева Алия Кайратовна , Бегзатқызы Ырысгүл , | ||
|
3
0
1
0
|
||
| Customer | МНВО РК | |
| Information on the executing organization | ||
| Short name of the ministry (establishment) | Нет | |
| Full name of the service recipient | ||
| "Международный университет информационных технологий" | ||
| Abbreviated name of the service recipient | МУИТ | |
| Abstract | ||
|
Объектом исследования являются финансовые транзакции и их графовые представления, подлежащие анализу методами машинного обучения в многокомпонентной платформе мониторинга. Зерттеу нысаны қаржылық транзакциялар және олардың графтық көрсетілімдері, оларды мониторингтің көпкомпонентті платформасында машиналық оқыту әдістерімен талдауға жатады. Обзор методов интеллектуального анализа, которые можно использовать для выявления финансовых преступлений. Разработка модели машинного обучения для выявления финансирования террористических организаций на основе открытых данных для определения максимально возможного набора аномалий финансирования. Қаржылық қылмыстарды анықтау үшін қолдануға болатын интеллектуалды талдау әдістеріне шолу. Қаржыландыру ауытқуларының ең жоғары жиынтығын анықтау үшін ашық деректер негізінде террористік ұйымдарды қаржыландыруды анықтау үшін машиналық оқыту моделін әзірлеу Методология: - аналитический обзор подходов (rule-based/статистические, классические ML, DL/GNN); - графовое моделирование транзакций; - использование синтетических данных AMLSim для постановки и тестирования сценариев; - разработка и интеграция диск-базированного графового предпроцессора DGFP в ML-пайплайн платформы. Әдістеме: - тәсілдердің аналитикалық шолуы (rule-based/статистикалық, классикалық ML, DL/GNN); - транзакцияларды графтық модельдеу; - сценарийлерді қою және тестілеу үшін AMLSim синтетикалық деректерін пайдалану; - платформаның ML-пайплайнына дискіге негізделген графтық препроцессор DGFP-ті әзірлеу және интеграциялау. Новизна: предложен гибридный ML-подход к анализу транзакций, в котором DGFP обеспечивает масштабируемую обработку больших графов за счет разделения хранения и вычислений, ленивых вычислений и иерархического кэширования, а так же применен компонентно-ориентированный анализ сетевых структур в составе архитектуры. Краткая характеристика результатов: - описаны теоретико-методологические основы; - сформулирована постановка и разработаны модели; - представлена архитектура платформы с отдельным модулем машинного обучения; - описан и реализован DGFP; - выполнены экспериментальные исследования на синтетических наборах (AMLSim) и обсуждены аспекты внедрения. Жаңалығы: транзакцияларды талдаудың гибридті ML-қатынасы ұсынылған, онда DGFP сақтау мен есептеуді бөлу, lazy есептеулер және иерархиялық кэштеу есебінен ірі графтарды масштабты өңдеуді қамтамасыз етеді, сондай-ақ архитектура құрамында желілік құрылымдарды компоненттік-бағдарлы талдау қолданылған. Нәтижелердің қысқаша сипаттамасы: - теориялық-әдіснамалық негіздер сипатталған; - есептің қойылымы жасалып, модельдер әзірленген; - машиналық оқытуға арналған жеке модулі бар платформаның архитектурасы ұсынылған; - DGFP сипатталып, іске асырылған; - синтетикалық жиынтықтарда (AMLSim) эксперименттік зерттеулер жүргізіліп, енгізу аспектілері талқыланған. Выполнен системный анализ и сравнение методов машинного обучения для детектирования подозрительных финансовых взаимодействий: классические ML (Logistic Regression, Random Forest/XGBoost), методы выявления аномалий (Isolation Forest, Autoencoder), а также графовые и трансформер-ориентированные подходы (GNN/Transformer) на транзакционных графах. Сформулирована математическая постановка бинарной классификации в графовом представлении с учётом дисбаланса классов, разработан компонентно-ориентированный конструкт признаков на основе мотивов (fan-in/out, scatter-gather, циклы, multi-hop). Построена гибридная архитектура обучения с диск-базированным графовым предпроцессором (DGFP) как ресурсно-экономичным слоем подготовки данных, экспериментальный контур включает метрики качества (Precision/Recall/F1, PR-AUC) и вычислительные критерии (латентность, пиковое потребление ОЗУ). Жүйелі талдау жүргізіліп, күмәнді қаржылық өзара әрекеттерді анықтауға арналған машиналық оқыту әдістері салыстырылды: классикалық ML (Logistic Regression, Random Forest/XGBoost), аномалияларды анықтау тәсілдері (Isolation Forest, Autoencoder), сондай-ақ транзакциялық графтардағы графтық және трансформерге бағытталған тәсілдер (GNN/Transformer). Кластар теңгерімсіздігін ескере отырып, графтық көрсетілім негізінде бинарлық жіктеудің математикалық қойылымы тұжырымдалды, мотивтерге (fan-in/out, scatter-gather, циклдер, multi-hop) негізделген компоненттік бағыттағы белгілер конструкторы әзірленді. Дискілік негіздегі графтық алдын ала өңдегіш (DGFP) қолданылған деректерді дайындаудың ресурсты үнемдейтін қабаты ретінде гибридті оқыту архитектурасы құрылды, ал эксперименттік контур сапа метрикаларын (Precision/Recall/F1, PR-AUC) және есептеу критерийлерін (латенттілік, жедел жадтың шекті тұтынуы) қамтиды. Материалы приняты к рассмотрению АФМ: выполнены лабораторно-стендовые эксперименты на синтетических и обезличенных наборах с воспроизводимым ML-пайплайном и документация. Материалдар АФМ-де қарауға қабылданды: синтетикалық және дербестендірілмеген деректер жиынтықтарында қайталанбалы ML-пайплайнымен зертханалық-стендтік эксперименттер орындалды, құжаттама дайындалды. Гибридный контур DGFP + ML позволил повысить скорость и точность выявления аномальных транзакций. Среднее время принятия решения сократилось на примерно 45 % (с 750 ± 15 мс до 410 ± 15 мс), при этом интегральный показатель точности F1 вырос с 0,71 до 0,76. Доля корректных срабатываний увеличилась (с 0,68 до 0,74), что напрямую уменьшает количество ложных тревог и экономит время аналитиков. Пиковое потребление оперативной памяти снизилось почти вдвое (с 18,3 до 9,8 ГБ), благодаря чему система устойчиво обрабатывает большие потоки без наращивания инфраструктуры. В типовом режиме обеспечивается обработка пакетов до 10 000 транзакций с субсекундной задержкой P99 и пропускной способностью до 24 390 транзакций/с. В совокупности это ускоряет цикл «сигнал — проверка — решение» и повышает надёжность мониторинга финансовых операций. DGFP + ML гибридті контуры аномальды транзакцияларды анықтаудың жылдамдығы мен дәлдігін арттырды. Шешім қабылдаудың орташа уақыты шамамен 45 % қысқарды ( 750 ± 15 мс-тан 410 ± 15 мс-қа дейін), осынымен қатар интегралдық дәлдік көрсеткіші F1 0,71-ден 0,76-ға өсті. Дұрыс іске қосылулардың үлесі артты (0,68-ден 0,74-ке дейін), бұл жалған дабылдар санын тікелей азайтып, аналитиктердің уақытын үнемдейді. Жедел жадтың шыңдық тұтынуы екі есеге жуық төмендеді (18,3-тен 9,8 ГБ-қа дейін), соның арқасында жүйе инфрақұрылымды ұлғайтпай-ақ үлкен ағындарды тұрақты өңдейді. Типтік режимде 10 000 транзакцияға дейінгі пакеттер субсекундтық P99 кідіріспен өңделеді және өткізу қабілеті секундына 24 390 транзакцияға дейін жетеді. Жалпы алғанда, бұл «сигнал — тексеру — шешім» циклін жеделдетіп, қаржылық операцияларды мониторингілеудің сенімділігін арттырады. Системы финансового мониторинга и аналитические платформы AML государственных органов и финансовых организаций, образовательные и научно-исследовательские проекты по анализу транзакционных данных Мемлекеттік органдар мен қаржы ұйымдарының AML қаржылық мониторинг жүйелері және аналитикалық платформалары, транзакциялық деректерді талдауға арналған білім беру және ғылыми-зерттеу жобалары. |
||
| UDC indices | ||
| 004.891.2 | ||
| International classifier codes | ||
| 50.41.25; 20.23.17; 28.23.37; | ||
| Readiness of the development for implementation | ||
| Key words in Russian | ||
| МАШИННОЕ ОБУЧЕНИЕ; ГРАФОВЫЙ АНАЛИЗ; DGFP (ДИСК-БАЗИРОВАННЫЙ ГРАФОВЫЙ ПРЕДПРОЦЕССОР); ТРАНЗАКЦИОННЫЕ ГРАФЫ; АНОМАЛИИ; PAYSIM; AMLSIM; AML/CFT; | ||
| Key words in Kazakh | ||
| МАШИНАЛЫҚ ОҚЫТУ; ГРАФТЫҚ ТАЛДАУ; DGFP (ДИСКІГЕ НЕГІЗДЕЛГЕН ГРАФТЫҚ ПРЕПРОЦЕССОР); ТРАНЗАКЦИЯЛЫҚ ГРАФТАР; АНОМАЛИЯЛАР; PAYSIM; AMLSIM; AML/CFT; | ||
| Head of the organization | Колесникова Катерина Викторовна | Доктор технических наук / профессор |
| Head of work | Болшибаева Айгерим Какимжановна | Phd в области компьютерных наук / нет |
| Native executive in charge | Рахметулаева Сабина Батырхановна | ассоциированный профессор |