Inventory number | IRN | Number of state registration |
---|---|---|
0223РК00323 | AP09259309-OT-23 | 0121РК00404 |
Document type | Terms of distribution | Availability of implementation |
Заключительный | Gratis | Number of implementation: 1 Implemented |
Publications | ||
Native publications: 1 | ||
International publications: 5 | Publications Web of science: 3 | Publications Scopus: 4 |
Number of books | Appendicies | Sources |
1 | 5 | 126 |
Total number of pages | Patents | Illustrations |
114 | 0 | 9 |
Amount of funding | Code of the program | Table |
22737203 | AP09259309 | 7 |
Name of work | ||
Информационная модель и программный инструментарий системы автоматического поиска и анализа многоязычного противоправного веб-контента на базе онтологического подхода | ||
Report title | ||
Type of work | Source of funding | The product offerred for implementation |
Applied research | Программная документация | |
Report authors | ||
Мамырбаев Оркен Жумажанович , Хайрова Нина Феликсовна , Шаронова Наталья Валерьевна , Оралбекова Дина Орымбаевна , Мухсина Куралай Женисбековна , Ыбытаева Галия Сейткалиевна , Суиндиков Ержан Нурлыбекович , | ||
0
0
1
2
|
||
Customer | МНВО РК | |
Information on the executing organization | ||
Short name of the ministry (establishment) | МНВО РК | |
Full name of the service recipient | ||
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК | ||
Abbreviated name of the service recipient | ИИВТ | |
Abstract | ||
Модели и методы автоматического поиска и анализа противоправной текстовой информации казахского, русского и английского языков на базе онтологического подхода. Қазақ, орыс және ағылшын тілдеріндегі мәтіндік ақпараттарды онтологиялық тәсіл негізінде автоматты түрде іздеу және талдау модельдері мен әдістері. Разработка информационной модели системы автоматической идентификации противоправных текстов казахского, русского и английского языков в Интернет сетях. Разрабатываемая информационная модель включает онтологию «Противоправный Интернет-контент», специализированные корпуса текстов и программный инструментарий поиска и анализа экстремистских и противоправных текстов. Интернет желілерде қазақ, орыс және ағылшын тілдерінің құқыққа қайшы мәтіндерін автоматты түрде сәйкестендіру жүйесінің ақпараттық моделін әзірлеу. Әзірленіп жатқан ақпараттық модельге «Құқыққа қайшы Интернет-контент» онтологиясы, мәтіндердің мамандандырылған корпустары және экстремистік және құқыққа қайшы мәтіндерді іздеу және талдау бағдарламалық инструментарийі кіреді. Математические модели, алгоритмы и методы автоматического выявления фактической противоправной информации в текстовых массивах Мәтіндік массивтердегі нақты құқыққа қайшы ақпаратты автоматты түрде анықтау әдістері және алгоритмдері, математикалық модельдері Полученные результаты: разработан метод и осуществлена автоматическая генерация онтологии «Противоправный интернет-контент» для казахского, русского и английского языков; расширены многоязычные корпуса криминально значащей информации, содержащейся в Интернет сетях; разработан метод семантического анализа и семантической разметки корпусов, акцентированный на выделение лингвистических и лексических маркеров противоправного контента; создана интегрированная технология поиска и анализа противоправного контента в социальных сетях и других Интернет источниках, включающая методы машинного обучения и онтологический подход. Алынған нәтижелер: қазақ, орыс және ағылшын тілдері үшін «құқыққа қайшы интернет-контент» онтологиясының әдісі әзірленді және автоматты түрде генерациялау жүзеге асырылды; Интернет желілерінде қамтылған қылмыстық маңызы бар ақпараттың көптілді корпустары кеңейтілді; құқыққа қайшы контенттің лингвистикалық және лексикалық маркерлерін бөліп көрсетуге баса назар аудара отырып, корпустарды семантикалық талдау және семантикалық белгілеу әдісі әзірленді; әлеуметтік желілерде және басқа Интернет көздерінде машиналық оқыту әдістері мен онтологиялық тәсілді қамтитын құқыққа қайшы мазмұнды іздеу мен талдаудың интеграцияланған технологиясы құрылды. Созданная узкоспециализированная онтология «Противоправный Интернет-контент» представляет новый лингвистический ресурс казахского языка, повышающий научный потенциал последующих разработок. Жасалған жоғары мамандандырылған «Құқыққа қайшы Интернет-контент» онтологиясы кейінгі әзірлемелердің ғылыми әлеуетін арттыратын қазақ тілінің жаңа лингвистикалық ресурсын ұсынады. Результаты проекта были внедрены в Управление криминальной полиции ДП области Жетісу. Жобаның нәтижелері Жетісу облысы ПД криминалдық полиция Басқармасына енгізілді. Реализация данного проекта позволяет повысить эффективность смысловой обработки текстов на казахском, русском и английском языках Осы жобаны іске асыру қазақ, орыс және ағылшын тілдеріндегі мәтіндерді мағыналық өңдеудің тиімділігін арттыруға мүмкіндік береді Правоохранительные и специальные государственные организации; социальные службы; учебные заведения и другие государственные учреждения. Құқық қорғау және арнаулы мемлекеттік органдар; әлеуметтік қызметтер; оқу орындары және басқа да мемлекеттік мекемелер. |
||
UDC indices | ||
004.89 | ||
International classifier codes | ||
28.23.29; 28.23.17; | ||
Readiness of the development for implementation | ||
Key words in Russian | ||
компьютерная лингвистика; лингвистический корпус; информационный поиск; машинное обучение; онтологический подход; | ||
Key words in Kazakh | ||
компьютерлік лингвистика; лингвистикалық корпус; ақпараттық іздеу; машиналық оқыту; онтологиялық тәсіл; | ||
Head of the organization | Мутанов Галимкаир Мутанович | Доктор технических наук / профессор |
Head of work | Мамырбаев Оркен Жумажанович | PhD / Профессор |
Native executive in charge |