Inventory number IRN Number of state registration
0323РК00503 AP19677756-KC-23 0123РК00617
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 1
International publications: 0 Publications Web of science: 0 Publications Scopus: 0
Patents Amount of funding Code of the program
0 26976057.5 AP19677756
Name of work
Неконтролируемое извлечение терминов: комплект моделей и наборов данных для высокотехнологических доменов и малоресурсных языков
Type of work Source of funding Report authors
Applied Нугуманова Алия Багдатовна
0
4
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) Нет
Full name of the service recipient
Товарищество с ограниченной ответственностью "Astana IT University"
Abbreviated name of the service recipient "Astana IT University"
Abstract

Контролируемые модели извлечения терминов

Терминдерді шығару бақыланатын үлгілері

Обеспечить конкурентоспособность контролируемых моделей извлечения терминов при использовании автоматически сгенерированных обучающих данных.

Автоматты түрде жасалған оқу деректерін пайдалану кезінде бақыланатын терминдерді шығару үлгілерінің бәсекеге қабілетті екеніне көз жеткізіңіз.

Применялись методы и инструменты обработки естественного языка, метод неотрицательной матричной факторизации, модели семантических эмбеддингов.

Табиғи тілді өңдеудің әдістері мен құралдары, теріс емес матрицалық факторизация әдісі және семантикалық кірістіру модельдері қолданылды.

Разработаны эффективные неконтролируемые аннотаторы UA1 и UA2. Разработан новый эффективный оптимизатор корпуса текстов.

UA1 және UA2 тиімді бақыланбайтын аннотаторлар әзірленді. Жаңа тиімді мәтіндік корпусты оңтайландырушы әзірленді.

Точность аннотаторов в диапазоне 20-40% в зависимости от языка, что свидетельствует о конкурентоспособности разработанных решений.

Аннотаторлардың дәлдігі тілге байланысты 20-40% диапазонында, бұл әзірленген шешімдердің бәсекеге қабілеттілігін көрсетеді.

приложения искусственного интеллекта, интеллектуальные информационные системы, человеко-машинные интерфейсы

жасанды интеллект қолданбалары, интеллектуалды ақпараттық жүйелер, адам мен машина интерфейстері

UDC indices
004.83
International classifier codes
28.23.37;
Key words in Russian
Обработка естественного языка; Малоресурсные языки; Извлечение терминов; Трансформеры; Неконтролируемое и контролируемое обучение;
Key words in Kazakh
Табиғи тілді өңдеу; Ресурсы аз тілдер; Терминдерді шығару; Трансформерлер; Бақыланбайтын және бақыланатын оқыту;
Head of the organization Омирбаев Серик Мауленович Доктор экономических наук / Профессор
Head of work Нугуманова Алия Багдатовна PhD in Information Systems / -