Inventory number IRN Number of state registration
0223РК00323 AP09259309-OT-23 0121РК00404
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 1
Implemented
Publications
Native publications: 1
International publications: 5 Publications Web of science: 3 Publications Scopus: 4
Number of books Appendicies Sources
1 5 126
Total number of pages Patents Illustrations
114 0 9
Amount of funding Code of the program Table
22737203 AP09259309 7
Name of work
Информационная модель и программный инструментарий системы автоматического поиска и анализа многоязычного противоправного веб-контента на базе онтологического подхода
Report title
Type of work Source of funding The product offerred for implementation
Applied research Программная документация
Report authors
Мамырбаев Оркен Жумажанович , Хайрова Нина Феликсовна , Шаронова Наталья Валерьевна , Оралбекова Дина Орымбаевна , Мухсина Куралай Женисбековна , Ыбытаева Галия Сейткалиевна , Суиндиков Ержан Нурлыбекович ,
0
0
1
2
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Abbreviated name of the service recipient ИИВТ
Abstract

Модели и методы автоматического поиска и анализа противоправной текстовой информации казахского, русского и английского языков на базе онтологического подхода.

Қазақ, орыс және ағылшын тілдеріндегі мәтіндік ақпараттарды онтологиялық тәсіл негізінде автоматты түрде іздеу және талдау модельдері мен әдістері.

Разработка информационной модели системы автоматической идентификации противоправных текстов казахского, русского и английского языков в Интернет сетях. Разрабатываемая информационная модель включает онтологию «Противоправный Интернет-контент», специализированные корпуса текстов и программный инструментарий поиска и анализа экстремистских и противоправных текстов.

Интернет желілерде қазақ, орыс және ағылшын тілдерінің құқыққа қайшы мәтіндерін автоматты түрде сәйкестендіру жүйесінің ақпараттық моделін әзірлеу. Әзірленіп жатқан ақпараттық модельге «Құқыққа қайшы Интернет-контент» онтологиясы, мәтіндердің мамандандырылған корпустары және экстремистік және құқыққа қайшы мәтіндерді іздеу және талдау бағдарламалық инструментарийі кіреді.

Математические модели, алгоритмы и методы автоматического выявления фактической противоправной информации в текстовых массивах

Мәтіндік массивтердегі нақты құқыққа қайшы ақпаратты автоматты түрде анықтау әдістері және алгоритмдері, математикалық модельдері

Полученные результаты: разработан метод и осуществлена автоматическая генерация онтологии «Противоправный интернет-контент» для казахского, русского и английского языков; расширены многоязычные корпуса криминально значащей информации, содержащейся в Интернет сетях; разработан метод семантического анализа и семантической разметки корпусов, акцентированный на выделение лингвистических и лексических маркеров противоправного контента; создана интегрированная технология поиска и анализа противоправного контента в социальных сетях и других Интернет источниках, включающая методы машинного обучения и онтологический подход.

Алынған нәтижелер: қазақ, орыс және ағылшын тілдері үшін «құқыққа қайшы интернет-контент» онтологиясының әдісі әзірленді және автоматты түрде генерациялау жүзеге асырылды; Интернет желілерінде қамтылған қылмыстық маңызы бар ақпараттың көптілді корпустары кеңейтілді; құқыққа қайшы контенттің лингвистикалық және лексикалық маркерлерін бөліп көрсетуге баса назар аудара отырып, корпустарды семантикалық талдау және семантикалық белгілеу әдісі әзірленді; әлеуметтік желілерде және басқа Интернет көздерінде машиналық оқыту әдістері мен онтологиялық тәсілді қамтитын құқыққа қайшы мазмұнды іздеу мен талдаудың интеграцияланған технологиясы құрылды.

Созданная узкоспециализированная онтология «Противоправный Интернет-контент» представляет новый лингвистический ресурс казахского языка, повышающий научный потенциал последующих разработок.

Жасалған жоғары мамандандырылған «Құқыққа қайшы Интернет-контент» онтологиясы кейінгі әзірлемелердің ғылыми әлеуетін арттыратын қазақ тілінің жаңа лингвистикалық ресурсын ұсынады.

Результаты проекта были внедрены в Управление криминальной полиции ДП области Жетісу.

Жобаның нәтижелері Жетісу облысы ПД криминалдық полиция Басқармасына енгізілді.

Реализация данного проекта позволяет повысить эффективность смысловой обработки текстов на казахском, русском и английском языках

Осы жобаны іске асыру қазақ, орыс және ағылшын тілдеріндегі мәтіндерді мағыналық өңдеудің тиімділігін арттыруға мүмкіндік береді

Правоохранительные и специальные государственные организации; социальные службы; учебные заведения и другие государственные учреждения.

Құқық қорғау және арнаулы мемлекеттік органдар; әлеуметтік қызметтер; оқу орындары және басқа да мемлекеттік мекемелер.

UDC indices
004.89
International classifier codes
28.23.29; 28.23.17;
Readiness of the development for implementation
Key words in Russian
компьютерная лингвистика; лингвистический корпус; информационный поиск; машинное обучение; онтологический подход;
Key words in Kazakh
компьютерлік лингвистика; лингвистикалық корпус; ақпараттық іздеу; машиналық оқыту; онтологиялық тәсіл;
Head of the organization Мутанов Галимкаир Мутанович Доктор технических наук / профессор
Head of work Мамырбаев Оркен Жумажанович PhD / Ассоциированный профессор
Native executive in charge