Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0323РК00503 | AP19677756-KC-23 | 0123РК00617 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 1 | ||||
International publications: 0 | Publications Web of science: 0 | Publications Scopus: 0 | ||
Patents | Amount of funding | Code of the program | ||
0 | 26976057.5 | AP19677756 | ||
Name of work | ||||
Неконтролируемое извлечение терминов: комплект моделей и наборов данных для высокотехнологических доменов и малоресурсных языков | ||||
Type of work | Source of funding | Report authors | ||
Applied | Нугуманова Алия Багдатовна | |||
0
4
0
0
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | Нет | |||
Full name of the service recipient | ||||
Товарищество с ограниченной ответственностью "Astana IT University" | ||||
Abbreviated name of the service recipient | "Astana IT University" | |||
Abstract | ||||
Контролируемые модели извлечения терминов Терминдерді шығару бақыланатын үлгілері Обеспечить конкурентоспособность контролируемых моделей извлечения терминов при использовании автоматически сгенерированных обучающих данных. Автоматты түрде жасалған оқу деректерін пайдалану кезінде бақыланатын терминдерді шығару үлгілерінің бәсекеге қабілетті екеніне көз жеткізіңіз. Применялись методы и инструменты обработки естественного языка, метод неотрицательной матричной факторизации, модели семантических эмбеддингов. Табиғи тілді өңдеудің әдістері мен құралдары, теріс емес матрицалық факторизация әдісі және семантикалық кірістіру модельдері қолданылды. Разработаны эффективные неконтролируемые аннотаторы UA1 и UA2. Разработан новый эффективный оптимизатор корпуса текстов. UA1 және UA2 тиімді бақыланбайтын аннотаторлар әзірленді. Жаңа тиімді мәтіндік корпусты оңтайландырушы әзірленді. Точность аннотаторов в диапазоне 20-40% в зависимости от языка, что свидетельствует о конкурентоспособности разработанных решений. Аннотаторлардың дәлдігі тілге байланысты 20-40% диапазонында, бұл әзірленген шешімдердің бәсекеге қабілеттілігін көрсетеді.
приложения искусственного интеллекта, интеллектуальные информационные системы, человеко-машинные интерфейсы жасанды интеллект қолданбалары, интеллектуалды ақпараттық жүйелер, адам мен машина интерфейстері |
||||
UDC indices | ||||
004.83 | ||||
International classifier codes | ||||
28.23.37; | ||||
Key words in Russian | ||||
Обработка естественного языка; Малоресурсные языки; Извлечение терминов; Трансформеры; Неконтролируемое и контролируемое обучение; | ||||
Key words in Kazakh | ||||
Табиғи тілді өңдеу; Ресурсы аз тілдер; Терминдерді шығару; Трансформерлер; Бақыланбайтын және бақыланатын оқыту; | ||||
Head of the organization | Омирбаев Серик Мауленович | Доктор экономических наук / Профессор | ||
Head of work | Нугуманова Алия Багдатовна | PhD in Information Systems / - |