Inventory number IRN Number of state registration
0223РК00744 BR21882268-OT-23 0123РК01142
Document type Terms of distribution Availability of implementation
Промежуточный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 0 Publications Web of science: 0 Publications Scopus: 0
Number of books Appendicies Sources
1 3 94
Total number of pages Patents Illustrations
85 0 16
Amount of funding Code of the program Table
71722173 Ф.1165 6
Code of the program's task under which the job is done
01
Name of work
Автоматическое построение мультиязычной онтологии для расширения применимости казахского языка на основе передовых интеллектуальных технологий.
Report title
Type of work Source of funding The product offerred for implementation
Fundamental Метод, способ
Report authors
Мусабаев Рустам Рафикович , Төлеу Алымжан , Красовицкий Александр Михайлович , Ахметов Искандер Рафаилович , Барахнин Владимир Борисович , Төлеген Гүлмира , Козбагаров Олжас Барлыкович , Мусабаев Равиль Рафикович , Кульдеев Нұрсұлтан Ержанұлы , Сағынұлы Санжар , Ибраймова Айнур Туребековна , Жұлдузбайұлы Нұрбақыт ,
0
0
0
1
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Некоммерческое акционерное общество "Казахский Национальный Исследовательский технический университет имени К.И. Сатпаева"
Abbreviated name of the service recipient НАО «КазНИТУ им. К.И. Сатпаева»
Abstract

Объектом исследования являются методы построения мультиязычного управляемого тезауруса отраслевых терминов для формирования терминологического ядра онтологии NLP. В частности, фокус делается на алгоритмах и подходах, используемых для извлечения и структурирования знаний из текстов на разных языках, включая казахский.

Зерттеу объектісі NLP онтологиясының терминологиялық өзегін қалыптастыру үшін салалық терминдердің көптілді басқарылатын тезаурус құру әдістері. Атап айтқанда, әртүрлі тілдердегі, соның ішінде қазақ тіліндегі мәтіндерден білімді экстрациялау және құрылымдау үшін қолданылатын алгоритмдер мен тәсілдерге назар аударылады.

Целью данной работы является разработка средств автоматизированного наполнения контента интеллектуального информационного ресурса NLP, что подразумевает создание и внедрение эффективных алгоритмов и технологий, способных обрабатывать и анализировать большие объемы текстовых данных на разных языках для извлечения полезной информации и знаний для заданной предметной области.

Жұмыстың мақсаты NLP интеллектуалды ақпараттық ресурсының мазмұнын автоматтандырылған толтыру құралдарын әзірлеу, соған арналған тиімді алгоритмдер мен технологияларды құру. Бұл берілген пәндік салаға арналған білім және әртүрлі тілдердегі үлкен көлемдегі мәтіндік деректерді өңдеуге және талдауға қабілетті.

Для достижения цели и решения задач исследования на каждом этапе работы использовались различные методы и подходы, такие как алгоритмы обработки естественного языка, семантический анализ и извлечение знаний, техники векторного представления слов и текста, методы автоматического построения и обогащения мультиязычного управляемого тезауруса отраслевых терминов с целью формирования терминологического ядра онтологии NLP.

Мақсатқа жету және зерттеу міндеттерін шешу үшін жұмыстың әр кезеңінде табиғи тілді өңдеу алгоритмдері, семантикалық талдау және білімді экстрациялау, сөздер мен мәтінді векторлық бейнелеу әдістері, автоматты түрде құру сияқты әртүрлі әдістер мен тәсілдер қолданылды. Сонымен қатар, NLP онтологиясының терминологиялық өзегін қалыптастыру үшін салалық терминдердің көптілді бақыланатын тезаурусын дамыту.

В рамках данного проекта за отчётный период в соответствие с календарным планом получены следующие основные результаты: 1) Результаты изученных теоретических, методологических основ методов NLP (Natural Language Processing), их реализации и использованных тестовых данных и информационных ресурсов (раздел 1); 2) Результаты разработки структуры, методики и методов автоматизации построения многоязычного словаря по современным методам NLP, включающего термины на казахском, английском и русском языках (раздел 2); 3) Подготовленные концепции предметной области NLP для построения терминологического ядра онтологии NLP (раздел 3). Все поставленные задачи соответствуют современным достижениям научно-технического прогресса и обладают достаточной степенью новизны.

Осы жоба аясында есептік кезеңде күнтізбелік жоспарға сәйкес келесі негізгі нәтижелер алынды: 1) NLP (Natural Language Processing) әдістерінің зерттелген теориялық, әдістемелік негіздерінің нәтижелері, оларды енгізу және сынақ деректері мен пайдаланылған ақпараттық ресурстар (1-бөлім); 2) NLP заманауи әдістерін, оның ішінде қазақ, ағылшын және орыс тілдеріндегі терминдерді қолдана отырып, көптілді сөздік құруды автоматтандырудың құрылымын, әдістемесін және әдістерін әзірлеу нәтижелері (2-бөлім); 3) NLP онтологиясының терминологиялық өзегін құру үшін NLP доменінің тұжырымдамалары дайындалды (3-бөлім). Қойылған барлық міндеттер ғылыми-техникалық прогрестің заманауи жетістіктеріне сәйкес келеді және жеткілікті жаңалық дәрежесіне ие.

Ключевые показатели: подготовленные концепции предметной области NLP для построения терминологического ядра онтологии NLP (раздел 3).

Негізгі көрсеткіштер: NLP онтологиясының терминологиялық өзегін құру үшін дайындалған NLP домен тұжырымдамалары (3-бөлім).

не внедрено

енгізілмейді

Разработанные методы и алгоритмы обладают достаточной степенью эффективности и проверены на уровне проведённых экспериментов.

Жасалған әдістер мен алгоритмдер жеткілікті тиімділік дәрежесіне ие және тәжірибе деңгейінде тексерілді.

Обработка текстов на естественном языке

Табиғи тілдегі мәтінді өңдеу

UDC indices
004.082
International classifier codes
20.19.00;
Readiness of the development for implementation
Key words in Russian
искусственный интеллект; машинное обучение; построение онтологий; эмбеддинги; методы оптимизации; обнаружение знаний;
Key words in Kazakh
жасанды интеллект; машиналық оқыту; онтологияны құру; эмбеддинг репрезентациясы; озық оңтайландыру әдістері; білімді сүзгілеу;
Head of the organization Кульдеев Ержан Итеменович Кандидат геолого-минералогических наук / профессор
Head of work Мусабаев Рустам Рафикович Кандидат технических наук / ассоциированный профессор (доцент)
Native executive in charge Төлеу Алымжан Researcher