| Inventory number | IRN | Number of state registration |
|---|---|---|
| 0225РК00945 | AP19677835-OT-25 | 0123РК00861 |
| Document type | Terms of distribution | Availability of implementation |
| Заключительный | Gratis | Number of implementation: 1 Implemented |
| Publications | ||
| Native publications: 3 | ||
| International publications: 5 | Publications Web of science: 1 | Publications Scopus: 3 |
| Number of books | Appendicies | Sources |
| 1 | 3 | 86 |
| Total number of pages | Patents | Illustrations |
| 118 | 0 | 45 |
| Amount of funding | Code of the program | Table |
| 34976241 | AP19677835 | 13 |
| Name of work | ||
| Исследование моделей и разработка интеллектуальной вопросно-ответной системы на основе семантических подходов для государственного языка в сфере законодательства Республики Казахстан | ||
| Report title | ||
| Type of work | Source of funding | The product offerred for implementation |
| Applied | Методическая документация | |
| Report authors | ||
| Рахимова Диана Рамазановна , Тукеев Уалшер Ануарбекович , Турарбек Әсем Турарбекқызы , Шормакова Асем Ноябревна , Кәрібаева Айдана Сейілғазықызы , Карюкин Владислав Игоревич , Әмірова Дина Тарихатқызы , Кульжанова Акбота Акылбековна , Төлеуғали Шадияр , Алиев Рашид Шамильевич , Сарсенбаева Асия Калисеитовна , | ||
|
0
0
1
0
|
||
| Customer | МНВО РК | |
| Information on the executing organization | ||
| Short name of the ministry (establishment) | МНВО РК | |
| Full name of the service recipient | ||
| Некоммерческое акционерное общество "Казахский национальный университет имени аль-Фараби" | ||
| Abbreviated name of the service recipient | НАО "КазНУ им. аль-Фараби" | |
| Abstract | ||
|
Вопросно-ответные системы , методы семантического анализа, законодательные и нормативные документы, казахский язык. Сұрақ-жауап жүйелері, семантикалық талдау әдістері, заңнамалық және нормативтік құжаттар, қазақ тілі. Целью проекта является исследование задачи и разработка вопросно-ответной технологии (алгоритмы, модели, системы) на казахском языке в сфере законодательства Республики Казахстан, на основе современных семантических подходов и нейросетевом обучении. Жобаның мақсаты – қазіргі семантикалық тәсілдер мен нейрондық желіні оқыту негізінде Қазақстан Республикасының заңнамасы саласында мәселені зерттеу және қазақ тілінде сұрақ-жауап технологиясын (алгоритмдер, модельдер, жүйелер) әзірлеу. Модели, методы и программные средства по обработке естественного языка, формальные грамматики, семантический анализ естественного языка, машинное обучение Формальды грамматика, табиғи тілді өңдеуге және семантикалық талдауға, машиналық оқытуға арналған модельдер, әдістер және бағдарламалық құралдар Собран и обработан электронный корпус правовых документов, включающая более 9,5 тыс. документов, 506 тыс. предложений и 6 тыс. пар «вопрос – ответ». Разработан метод определения семантической близости слов и фраз казахского языка на основе контекстных множеств и взвешенных коэффициентов синонимичности, а также внедрение гибридных архитектур нейронных сетей с использованием моделей BERT, GPT-4, LLaMA и KazakhBERT Интегрирована технология Retrieval-Augmented Generation (RAG) , которая обеспечила повышение точности и релевантности ответов при обработке сложных правовых запросов. Создана интеллектуальная вопросно-ответная система Law-AI (https://law-ai.kz), обеспечивающая автоматический поиск, анализ и генерацию юридических ответов на основе нормативных актов Республики Казахстан По результатам выполнения проекта за 2023-2025 года опубликованы 20 публикации: в зарубежных изданиях – публикации, индексируемых в базах данных WoS и/или Scopus – 5 публикации. Из них: одна статья опубликована в журнале Computers ( Scopus, процентиль 84, Q1), одна статья в журнале Applied Sciences (Scopus, процентиль 79, Q1); три статьи — в журнале Springer серии Communications in Computer and Information Science (Scopus, процентиль 39, Q3); В отечественных изданиях, рекомендуемые КОКСОН МНиВО РК – 2 публикации; Опубликована одна монография в отечественном издании. Получены 4 авторских свидетельства на разработанные программы ЭВМ 9500-ден астам құжат, 506 000 сөйлем және 6 000 сұрақ-жауап жұбынан тұратын құқықтық құжаттардың электронды корпусы жиналып, өңделді. BERT, GPT-4, LLaMA және KazakhBERT үлгілерін қолдану арқылы гибридті нейрондық желі архитектурасын енгізумен қатар контекстік жиынтықтар мен салмақты синонимдік коэффициенттер негізінде қазақ сөздері мен сөз тіркестерінің мағыналық ұқсастығын анықтау әдістемесі әзірленді. Күрделі заңды сұрауларды өңдеу кезінде жауаптардың дәлдігі мен өзектілігін арттыратын Retrieval-Augmented Generation (RAG) технологиясы біріктірілді. Заң-AI (https://law-ai.kz) сұрақ-жауаптың интеллектуалды жүйесі құрылды. Ол Қазақстан Республикасының нормативтік құқықтық актілері негізінде автоматты түрде іздеуді, талдауды және заңды жауаптарды қалыптастыруды қамтамасыз етеді. Жобаны іске асыру нәтижесінде 2023-2025 жылдары 20 жарияланым жарияланды: WoS және/немесе Scopus деректер базасында индекстелген шетелдік журналдарда 5 жарияланым. Оның ішінде бір мақала Computers журналында (Scopus, 84-процентиль, Q1), бір мақала Applied Sciences журналында (Scopus, 79-процентиль, Q1); Springer журналындағы Communications in Computer and Information Science журналындағы үш мақала (Scopus, 39-процентиль, Q3); Қазақстан Республикасы Білім және ғылым министрлігінің Білім беру ұйымдарын зерттеу комитеті ұсынған отандық журналдарда 2 жарияланым жарияланды; отандық журналда бір монография жарияланды. Жасалған компьютерлік бағдарламаларға төрт авторлық куәлік алынды. Расходование средств финансирования производится согласно утвержденной смете. Разработанная интеллектуальная вопросно-ответная система Law-AI представляет собой веб-платформу, реализующую технологии семантического анализа и генеративного искусственного интеллекта (RAG, LLM). Система обеспечивает автоматическую обработку правовых запросов на казахском и русском языках, поиск релевантных нормативно-правовых актов и генерацию юридически корректных ответов. Объём созданного корпуса составляет более 9,5 тыс. документов, 506 тыс. предложений и 6 тыс. пар «вопрос–ответ». Система демонстрирует стабильную работу, среднее время отклика — 2,9–4,4 с, уровень экспертной оценки — 4,5/5. Показатели точности по метрикам составили: Precision = 0,91, Recall = 0,93, F1-score = 0,127, ROUGE-L = 0,78, METEOR = 0,81. Қаражат жұмсауы бекітілген құжатқа сәйкес жүргізіледі. Әзірленген Law-AI интеллектуалды сұрақ-жауап жүйесі - бұл семантикалық талдау және генеративті жасанды интеллект (RAG, LLM) технологияларын жүзеге асыратын веб-платформа. Жүйе қазақ және орыс тілдеріндегі құқықтық сауалдарды автоматты түрде өңдейді, тиісті құқықтық актілерді іздейді және заңды түрде дұрыс жауаптар береді. Құрылған корпуста 9 500-ден астам құжат, 506 000 сөйлем және 6 000 сұрақ-жауап жұбы бар. Жүйе орташа жауап беру уақыты 2,9–4,4 секунд және 4,5/5 сараптамалық бағалау ұпайымен тұрақты жұмысты көрсетеді. Дәлдік көрсеткіштері: Дәлдік = 0,91, Қайта шақыру = 0,93, F1 ұпайы = 0,127, ROUGE-L = 0,78, METEOR = 0,81. Результаты проекта внедрены в практическую деятельность филиала №1 «Арман» ТОО «Корпорация Алмалы». Система Law-AI используется для: - консультирования граждан и сотрудников по вопросам законодательства на казахском языке; - оптимизации доступа к нормативно-правовым актам и внутренним документам; - повышения эффективности правовой информатизации и автоматизации справочно-аналитических процессов; Жобаның нәтижелері «Алмалы Корпорациясы» ЖШС №1 «Арман» филиалының тәжірибелік қызметіне енгізілді. Law-AI жүйесі мыналар үшін қолданылады: - азаматтар мен қызметкерлерге қазақ тілінде заңгерлік кеңес беру; - нормативтік құқықтық актілерге және ішкі құжаттарға қолжетімділікті оңтайландыру; - құқықтық ақпараттық технологиялардың тиімділігін арттыру және анықтамалық-талдау процестерін автоматтандыру; Результаты проекта имеют высокую практическую, научную и социальную эффективность. В научном аспекте разработана новая методология семантического анализа для низкоресурсных языков, реализован гибридный подход с использованием трансформерных моделей (BERT, GPT-4, LLaMA, KazBERT). В техническом плане система обеспечивает снижение трудозатрат при обработке юридических запросов до 60 %, повышение скорости поиска нормативных актов более чем в 5 раз и уменьшение вероятности ошибок классификации запросов. Социальная эффективность выражается в расширении доступа граждан к законодательству на государственном языке и укреплении цифровой языковой среды Жобаның нәтижелері жоғары практикалық, ғылыми және әлеуметтік әсерге ие. Ғылыми тұрғыдан аз ресурсты тілдер үшін семантикалық талдаудың жаңа әдістемесі әзірленді және трансформаторлық үлгілерді (BERT, GPT-4, LLaMA, KazBERT) пайдалана отырып, гибридті тәсіл енгізілді. Техникалық тұрғыдан алғанда, жүйе заңды сұраныстарды өңдеуге жұмсалатын еңбек шығындарын 60%-ға дейін төмендетеді, нормативтік құжаттарды іздеу жылдамдығын бес еседен астамға арттырады және сұрауларды жіктеу қателерінің ықтималдығын азайтады. Әлеуметтік әсер азаматтардың мемлекеттік тілдегі заңнамаға қолжетімділігін кеңейтуден және цифрлық тілдік ортаны нығайтудан көрінеді. Результаты проекта и разработанная система Law-AI предназначены для использования: - в государственных органах и юридических службах — для автоматизации правового анализа и консультирования; - в образовательных организациях — как учебно-научный инструмент для подготовки специалистов в области права, лингвистики и ИТ; - в научно-исследовательских институтах — для проведения экспериментов по семантическому анализу и обучению моделей LLM для казахского языка; А так же результаты проекта могут дать мультипликативный, социальный и экономический эффект для граждан страны Практические результаты проекта могут применены в развитии юридической грамотности населения и удобстве консультативной помощи. Жобаның нәтижелері және әзірленген Заң-AI жүйесі келесідей пайдалануға арналған: - мемлекеттік органдарда және заң қызметтерінде — құқықтық талдау мен кеңес беруді автоматтандыру; - оқу орындарында — құқық, лингвистика және IT мамандарын даярлаудың оқу және ғылыми құралы ретінде; - ғылыми-зерттеу институттарында — семантикалық талдау бойынша эксперименттер жүргізу және қазақ тіліне арналған LLM үлгілерін оқыту үшін; Жобаның нәтижелері ел азаматтарына мультипликативті, әлеуметтік және экономикалық әсер етуі мүмкін. Жобаның практикалық нәтижелерін халық арасында құқықтық сауаттылықты дамытуға және заң көмегін көрсетудің ыңғайлылығын арттыруға қолдануға болады. |
||
| UDC indices | ||
| 004.421, 004.912 | ||
| International classifier codes | ||
| 20.00.00; 28.23.00; | ||
| Readiness of the development for implementation | ||
| Key words in Russian | ||
| казахский язык; вопросно-ответная система; семантика; искусственный интеллект; правовые тексты; | ||
| Key words in Kazakh | ||
| қазақ тілі; сұрақ -жауап жүйесі; семантика; жасанды интеллект; құқықтық мәтіндер; | ||
| Head of the organization | Айтжанова Жамила Нурматовна | Доктор экономических наук / ассоциированный профессор (доцент) |
| Head of work | Рахимова Диана Рамазановна | PhD / Ассоциированный профессор |
| Native executive in charge | ||