Inventory number IRN Number of state registration
0325РК00940 AP26195165-KC-25 0125РК00491
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 0 Publications Web of science: 0 Publications Scopus: 0
Patents Amount of funding Code of the program
0 35111915 AP26195165
Name of work
Разработка трехэтапного фреймворка на базе языковых моделей для интеграции новых концепций в онтологии
Type of work Source of funding Report authors
Fundamental Садирмекова Жанна Бакирбаевна
0
0
3
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) Нет
Full name of the service recipient
Учреждение "Q University"
Abbreviated name of the service recipient
Abstract

процесс и методы автоматизированного размещения концептов в онтологических структурах, интеллектуальная система (фреймворк)

онтологиялық құрылымдарға жаңа концепттерді автоматтандырылған түрде орналастыру үдерісі мен әдістері, интеллектуалды жүйе (фреймворк).

Целью этапа являлось создание научно обоснованной архитектуры фреймворка, обеспечивающего систематическое извлечение, выравнивание и валидацию новых концептов для расширения онтологий в прикладных доменах. Проблематика заключается в отсутствии воспроизводимого, методологически прозрачного контура «извлечение, сопоставление, формальное размещение», совместимого с практиками онтологической инженерии (OWL/Description Logics) и современными LLM-подходами.

Кезеңнің мақсаты қолданбалы домендерде онтологияны кеңейту үшін жаңа тұжырымдамаларды жүйелі түрде шығаруды, туралауды және валидациялауды қамтамасыз ететін ғылыми негізделген фреймворктың архитектурасын құру болды. Мәселе онтологиялық инженерия (OWL/Description Logics) тәжірибелерімен және заманауи LLM тәсілдерімен үйлесімді "шығару, салыстыру, формальды орналастыру" қайталанатын, әдіснамалық мөлдір контурдың болмауында жатыр.

Систематический обзор и критериальная оценка методов (SLR), экспертная валидация, проектирование архитектуры в OWL/SHACL, LLM-извлечение кандидатов и их выравнивание с онтологией с последующей логико-семантической проверкой и оценкой.

Әдістерді жүйелі шолу және критериалды бағалау (SLR), сараптамалық валидация, OWL/SHACL архитектурасын жобалау, LLM-үміткерлерді шығару және оларды онтологиямен туралау, содан кейін логикалық-семантикалық тексеру және бағалау.

Предложен воспроизводимый трехэтапный процесс интеграции концептов с объединением сильных сторон LLM (вариативность извлечения) и формальной онтологической валидации (гарантии согласованности). Новизна состоит в связном контуре «LLM-извлечение, метрическое выравнивание, логико-семантическая проверка» с управлением качеством и провенансом, применимом к мультиязычным корпусам и различным предметным областям.

LLM (экстракцияның өзгергіштігі) және ресми онтологиялық валидацияның (сәйкестік кепілдігі) күшті жақтарын біріктіре отырып, тұжырымдамаларды біріктірудің қайталанатын үш сатылы процесі ұсынылды. Жаңалық "LLM-экстракция, метрикалық туралау, логикалық-семантикалық тексеру" көп тілді корпустар мен әртүрлі пәндік салаларға қолданылатын сапа мен провансты басқарумен байланысты тізбектен тұрады.

Основные конструктивные и технико-экономические показатели включают повышение точности автоматического размещения концепций в онтологиях на 25–30% за счёт использования предобученных и крупных языковых моделей (PLM и LLM), сокращение времени обновления онтологий на 60–70% благодаря трёхэтапной архитектуре фреймворка и оптимизированным алгоритмам prompting, а также снижение потребности в экспертном участии на 40–50% при сохранении высокой точности классификации. Разрабатываемая система будет обладать высокой адаптивностью к различным предметным областям и форматам онтологий, что обеспечит её масштабируемость и устойчивость. Экономическая эффективность проекта проявится в снижении затрат на ручную актуализацию онтологий и повышении качества автоматизированной обработки знаний, улучшая соотношение стоимости и научно-практической отдачи.

Негізгі конструктивтік және техника-экономикалық көрсеткіштерге алдын ала үйретілген және ірі тілдік модельдерді (PLM және LLM) пайдалану арқылы онтологияларға жаңа ұғымдарды автоматты түрде орналастыру дәлдігін 25–30%-ға арттыру, фреймворктің үш кезеңді архитектурасы мен оңтайландырылған prompting алгоритмдерінің арқасында онтологияларды жаңарту уақытын 60–70%-ға қысқарту, сондай-ақ сарапшылардың қатысу қажеттілігін 40–50%-ға азайта отырып, жіктеу дәлдігін сақтау жатады. Дамытылатын жүйе әртүрлі пәндік салалар мен онтология форматтарына бейімделгіштігі жоғары болып, оның ауқымдылығы мен тұрақтылығын қамтамасыз етеді. Жобаның экономикалық тиімділігі онтологияларды қолмен жаңарту шығындарын азайту мен білімді автоматтандырылған өңдеудің сапасын арттыру арқылы шығын мен нәтижелілік арақатынасын жақсартудан көрініс табады.

На стадии разработки

Өңделу кезеңінде

Эффективность системы заключается в повышении точности интеграции новых понятий до 20–30 % и сокращении времени анализа данных на 25–40 %, что позволяет быстрее адаптировать онтологии к изменениям в различных областях знаний. Оптимизация вычислительных ресурсов и использование методов контрастивного обучения обеспечивают устойчивость и адаптивность системы.

Жүйенің тиімділігі жаңа ұғымдардың интеграциясының дәлдігін 20-30% - ға дейін арттыру және деректерді талдау уақытын 25-40% - ға қысқарту болып табылады, бұл онтологияны білімнің әртүрлі салаларындағы өзгерістерге тезірек бейімдеуге мүмкіндік береді. Есептеу ресурстарын оңтайландыру және контрастты оқыту әдістерін қолдану жүйенің тұрақтылығы мен бейімделуін қамтамасыз етеді.

Разработанные методологии и архитектурные решения могут применяться в университетах, научных центрах и исследовательских лабораториях для создания интеллектуальных систем управления знаниями, автоматизации анализа и структурирования больших массивов данных, а также для подготовки специалистов в области искусственного интеллекта, обработки естественного языка и онтологической инженерии. Кроме того, результаты исследования могут интегрироваться в национальные и международные научно-образовательные платформы, способствуя развитию междисциплинарных исследований и кооперации между научными коллективами.

Әзірленген әдістемелер мен архитектуралық шешімдер университеттерде, ғылыми орталықтарда және зерттеу зертханаларында білімді басқарудың интеллектуалды жүйелерін құру, үлкен деректер жиынтықтарын талдауды автоматтандыру және құрылымдау, сондай-ақ жасанды интеллект, табиғи тілді өңдеу және онтологиялық инженерия саласындағы мамандарды дайындау үшін қолданылуы мүмкін. Сонымен қатар, зерттеу нәтижелері ұлттық және халықаралық ғылыми- білім беру платформаларына интеграциялануы мүмкін, бұл пәнаралық зерттеулердің дамуына және ғылыми ұжымдар арасындағы ынтымақтастыққа ықпал етеді.

UDC indices
УДК 004.8:025.4
International classifier codes
20.23.25; 28.23.00; 28.23.17; 28.23.39;
Key words in Russian
Онтология; Обогащение онтологии; Размещение концепций; Предобученные языковые модели; Крупные языковые модели; Машинное обучение; Обработка естественного языка; Автоматизация обработки знаний; Семантические сети; Информационные технологии;
Key words in Kazakh
Онтология; Онтологияны байыту; Концепцияларды орналастыру; Алдын ала оқытылған тілдік модельдер; Үлкен тілдік модельдер; Машиналық оқыту; Табиғи тілді өңдеу; Білімді өңдеуді автоматтандыру; Семантикалық желілер; Ақпараттық технологиялар;
Head of the organization ДЖАНЕГИЗОВА АЙСУЛУ САБИРХАНОВНА / нет
Head of work Садирмекова Жанна Бакирбаевна Доктор философии (PhD) по специальности 6D070300-Информационные системы / Ассоциированный профессор по научному направлению «Компьютерные науки и информатика»