Inventory number IRN Number of state registration
0322РК01150 AP14972834-KC-22 0122РК00787
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 2
International publications: 0 Publications Web of science: 0 Publications Scopus: 0
Patents Amount of funding Code of the program
0 2967230 AP14972834
Name of work
Разработка полиязычной информационной системы для научно-образовательной деятельности с применением NLP
Type of work Source of funding Report authors
Applied Садирмекова Жанна Бакирбаевна
0
0
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Abbreviated name of the service recipient ИИВТ
Abstract

Объектом исследования в данной работе является процесс разработки автоматизированного наполнения контента информационной системы для научно-образовательной деятельности NLP.

Бұл жұмыстағы зерттеу объектісі NLP ғылыми-білім беру қызметі үшін ақпараттық жүйенің мазмұнын автоматтандырылған толтыруды әзірлеу процесі болып табылады.

Целью проекта является разработка полиязычной информационной системы поддержки научно- образовательной деятельности по современным методам автоматической обработки текстов, который должен обеспечить удобный содержательный доступ специалистам в области компьютерной лингвистики, специализирующимся в этой области, к информации об этих методах, включая их реализации, тестовые данные и другие информационные ресурсы по данной тематике.

Жобаның мақсаты мәтіндерді автоматты өңдеудің заманауи әдістері бойынша ғылыми-білім беру қызметін қолдаудың көптілді ақпараттық жүйесін әзірлеу болып табылады, ол осы салада маманданған компьютерлік лингвистика саласындағы мамандарға осы әдістер туралы ақпаратқа, олардың іске асырылуын, тестілік деректерді және тақырып бойынша басқа да ақпараттық ресурстарды қоса алғанда, ыңғайлы мазмұнды қолжетімділікті қамтамасыз етуі тиіс.

При выполнении проекта использовались методы системного анализа, искусственный интеллект (онтологии, семантические сети) и оригинальные авторские подходы, например, авторские методы создания словарей-тезаурусов и онтологий, вывода онтологий, визуализации онтологий и данных, создания эргономичных пользовательских web-интерфейсов на основе онтологий, получения информации из текстов на естественном языке.

Жобаны орындау кезінде жүйелік талдау әдістері, жасанды интеллект (онтология, семантикалық желілер) және түпнұсқа авторлық тәсілдер қолданылды, мысалы, сөздіктер-тезаурустар мен онтологияларды құрудың, онтологияларға қорытынды жасаудың, онтологиялар мен деректерді визуализациялаудың, онтологияларға негізделген эргономикалық пайдаланушы web-интерфейстерін құрудың, табиғи тілдегі мәтіндерден ақпарат алудың авторлық әдістері.

1. Былы собраны материалы по современным методам NLP, их реализациям и используемым тестовым данным и информационным ресурсам; 2. Была разработана система понятий предметной области NLP; Новизна проекта заключается в том, что впервые будет создан масштабный полиязычный ресурс на базе казахского языка, в рамках которого будет осуществлена систематизация информации по классическим и современным методам автоматической обработки текста.

1. NLP заманауи әдістері, оларды іске асыру және қолданылатын тестілік деректер мен ақпараттық ресурстар бойынша материалдар жиналды; 2. NLP пәндік саласы ұғымдарының жүйесі әзірленді; Жобаның жаңалығы қазақ тілі базасында алғаш рет ауқымды көптілді ресурс құрылатын болады, оның шеңберінде мәтінді автоматты өңдеудің классикалық және заманауи әдістері бойынша ақпаратты жүйелеу жүзеге асырылатын болады.

Полученные основные результаты позволят решить задачу поиска информации по всем современным методам NLP и позволят использовать их на практике при проведении национальных исследований в области компьютерной лингвистики и разработке прикладных систем NLP, в которых участвуют государственные и коммерческие организации.

Алынған негізгі нәтижелер барлық заманауи NLP әдістері бойынша ақпаратты іздеу мәселесін шешуге мүмкіндік береді және оларды компьютерлік лингвистика саласындағы ұлттық зерттеулерді жүргізуде және мемлекеттік және коммерциялық ұйымдар қатысатын NLP қолданбалы жүйелерін әзірлеуде тәжірибеде пайдалануға мүмкіндік береді.

На стадии разработки

Өңделу кезеңінде

Созданная полиязычная информационная система для научно-образовательной деятельности NLP облегчит поиск информации по всем современным методам автоматической обработки текстов и сделает возможным их практическое использование при проведении национальных исследований в области компьютерной лингвистики и разработке прикладных систем автоматической обработки текста, в которых заинтересованы государственные и коммерческие организации.

NLP ғылыми және білім беру қызметі үшін құрылған көптілді ақпараттық жүйе мәтінді автоматты өңдеудің барлық заманауи әдістері туралы ақпаратты іздеуді жеңілдетеді және оларды есептеуіш лингвистика саласындағы ұлттық зерттеулерді жүргізуде және қолданбалы автоматтандыруды әзірлеуде тәжірибеде пайдалануға мүмкіндік береді. Мемлекеттік және коммерциялық ұйымдар қызығушылық танытатын мәтінді өңдеу жүйелері.

UDC indices
УДК 004.855.5
International classifier codes
28.23.00; 20.23.25;
Key words in Russian
Информационные ресурсы; Онтология; Содержательный доступ к данным; Методы автоматической обработки текста; Извлечение информации из текста;
Key words in Kazakh
Ақпараттық ресурстар; Онтология; Мәліметтерге мазмұнды қол жеткізу; Мәтінді автоматты өңдеу әдістері; Мәтіннен ақпарат алу;
Head of the organization Мутанов Галимкаир Мутанович Доктор технических наук / профессор
Head of work Садирмекова Жанна Бакирбаевна Доктор философии (PhD) / no