Inventory number | IRN | Number of state registration |
---|---|---|
0223РК00744 | BR21882268-OT-23 | 0123РК01142 |
Document type | Terms of distribution | Availability of implementation |
Промежуточный | Gratis | Number of implementation: 0 Not implemented |
Publications | ||
Native publications: 0 | ||
International publications: 0 | Publications Web of science: 0 | Publications Scopus: 0 |
Number of books | Appendicies | Sources |
1 | 3 | 94 |
Total number of pages | Patents | Illustrations |
85 | 0 | 16 |
Amount of funding | Code of the program | Table |
71722173 | Ф.1165 | 6 |
Code of the program's task under which the job is done | ||
01 | ||
Name of work | ||
Автоматическое построение мультиязычной онтологии для расширения применимости казахского языка на основе передовых интеллектуальных технологий. | ||
Report title | ||
Type of work | Source of funding | The product offerred for implementation |
Fundamental | Метод, способ | |
Report authors | ||
Мусабаев Рустам Рафикович , Төлеу Алымжан , Красовицкий Александр Михайлович , Ахметов Искандер Рафаилович , Барахнин Владимир Борисович , Төлеген Гүлмира , Козбагаров Олжас Барлыкович , Мусабаев Равиль Рафикович , Кульдеев Нұрсұлтан Ержанұлы , Сағынұлы Санжар , Ибраймова Айнур Туребековна , Жұлдузбайұлы Нұрбақыт , | ||
0
0
0
1
|
||
Customer | МНВО РК | |
Information on the executing organization | ||
Short name of the ministry (establishment) | МНВО РК | |
Full name of the service recipient | ||
Некоммерческое акционерное общество "Казахский Национальный Исследовательский технический университет имени К.И. Сатпаева" | ||
Abbreviated name of the service recipient | НАО «КазНИТУ им. К.И. Сатпаева» | |
Abstract | ||
Объектом исследования являются методы построения мультиязычного управляемого тезауруса отраслевых терминов для формирования терминологического ядра онтологии NLP. В частности, фокус делается на алгоритмах и подходах, используемых для извлечения и структурирования знаний из текстов на разных языках, включая казахский. Зерттеу объектісі NLP онтологиясының терминологиялық өзегін қалыптастыру үшін салалық терминдердің көптілді басқарылатын тезаурус құру әдістері. Атап айтқанда, әртүрлі тілдердегі, соның ішінде қазақ тіліндегі мәтіндерден білімді экстрациялау және құрылымдау үшін қолданылатын алгоритмдер мен тәсілдерге назар аударылады. Целью данной работы является разработка средств автоматизированного наполнения контента интеллектуального информационного ресурса NLP, что подразумевает создание и внедрение эффективных алгоритмов и технологий, способных обрабатывать и анализировать большие объемы текстовых данных на разных языках для извлечения полезной информации и знаний для заданной предметной области. Жұмыстың мақсаты NLP интеллектуалды ақпараттық ресурсының мазмұнын автоматтандырылған толтыру құралдарын әзірлеу, соған арналған тиімді алгоритмдер мен технологияларды құру. Бұл берілген пәндік салаға арналған білім және әртүрлі тілдердегі үлкен көлемдегі мәтіндік деректерді өңдеуге және талдауға қабілетті. Для достижения цели и решения задач исследования на каждом этапе работы использовались различные методы и подходы, такие как алгоритмы обработки естественного языка, семантический анализ и извлечение знаний, техники векторного представления слов и текста, методы автоматического построения и обогащения мультиязычного управляемого тезауруса отраслевых терминов с целью формирования терминологического ядра онтологии NLP. Мақсатқа жету және зерттеу міндеттерін шешу үшін жұмыстың әр кезеңінде табиғи тілді өңдеу алгоритмдері, семантикалық талдау және білімді экстрациялау, сөздер мен мәтінді векторлық бейнелеу әдістері, автоматты түрде құру сияқты әртүрлі әдістер мен тәсілдер қолданылды. Сонымен қатар, NLP онтологиясының терминологиялық өзегін қалыптастыру үшін салалық терминдердің көптілді бақыланатын тезаурусын дамыту. В рамках данного проекта за отчётный период в соответствие с календарным планом получены следующие основные результаты: 1) Результаты изученных теоретических, методологических основ методов NLP (Natural Language Processing), их реализации и использованных тестовых данных и информационных ресурсов (раздел 1); 2) Результаты разработки структуры, методики и методов автоматизации построения многоязычного словаря по современным методам NLP, включающего термины на казахском, английском и русском языках (раздел 2); 3) Подготовленные концепции предметной области NLP для построения терминологического ядра онтологии NLP (раздел 3). Все поставленные задачи соответствуют современным достижениям научно-технического прогресса и обладают достаточной степенью новизны. Осы жоба аясында есептік кезеңде күнтізбелік жоспарға сәйкес келесі негізгі нәтижелер алынды: 1) NLP (Natural Language Processing) әдістерінің зерттелген теориялық, әдістемелік негіздерінің нәтижелері, оларды енгізу және сынақ деректері мен пайдаланылған ақпараттық ресурстар (1-бөлім); 2) NLP заманауи әдістерін, оның ішінде қазақ, ағылшын және орыс тілдеріндегі терминдерді қолдана отырып, көптілді сөздік құруды автоматтандырудың құрылымын, әдістемесін және әдістерін әзірлеу нәтижелері (2-бөлім); 3) NLP онтологиясының терминологиялық өзегін құру үшін NLP доменінің тұжырымдамалары дайындалды (3-бөлім). Қойылған барлық міндеттер ғылыми-техникалық прогрестің заманауи жетістіктеріне сәйкес келеді және жеткілікті жаңалық дәрежесіне ие. Ключевые показатели: подготовленные концепции предметной области NLP для построения терминологического ядра онтологии NLP (раздел 3). Негізгі көрсеткіштер: NLP онтологиясының терминологиялық өзегін құру үшін дайындалған NLP домен тұжырымдамалары (3-бөлім). не внедрено енгізілмейді Разработанные методы и алгоритмы обладают достаточной степенью эффективности и проверены на уровне проведённых экспериментов. Жасалған әдістер мен алгоритмдер жеткілікті тиімділік дәрежесіне ие және тәжірибе деңгейінде тексерілді. Обработка текстов на естественном языке Табиғи тілдегі мәтінді өңдеу |
||
UDC indices | ||
004.082 | ||
International classifier codes | ||
20.19.00; | ||
Readiness of the development for implementation | ||
Key words in Russian | ||
искусственный интеллект; машинное обучение; построение онтологий; эмбеддинги; методы оптимизации; обнаружение знаний; | ||
Key words in Kazakh | ||
жасанды интеллект; машиналық оқыту; онтологияны құру; эмбеддинг репрезентациясы; озық оңтайландыру әдістері; білімді сүзгілеу; | ||
Head of the organization | Кульдеев Ержан Итеменович | Кандидат геолого-минералогических наук / профессор |
Head of work | Мусабаев Рустам Рафикович | Кандидат технических наук / ассоциированный профессор (доцент) |
Native executive in charge | Төлеу Алымжан | Researcher |