Inventory number IRN Number of state registration
0224РК00849 AP14972834-OT-24 0122РК00787
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 2
International publications: 1 Publications Web of science: 0 Publications Scopus: 0
Number of books Appendicies Sources
1 3 47
Total number of pages Patents Illustrations
70 0 16
Amount of funding Code of the program Table
7973137 AP14972834 1
Name of work
Разработка полиязычной информационной системы для научно-образовательной деятельности с применением NLP
Report title
Type of work Source of funding The product offerred for implementation
Applied Модель
Report authors
Садирмекова Жанна Бакирбаевна , Самбетбаева Мадина Аралбаевна ,
0
0
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Abbreviated name of the service recipient ИИВТ
Abstract

Объектом исследования в данной работе является процесс разработки автоматизированного наполнения контента информационной системы для научно-образовательной деятельности NLP.

Бұл жұмыстағы зерттеу объектісі NLP ғылыми-білім беру қызметі үшін ақпараттық жүйенің мазмұнын автоматтандырылған толтыруды әзірлеу процесі болып табылады.

Целью проекта является разработка полиязычной информационной системы поддержки научно- образовательной деятельности по современным методам автоматической обработки текстов, который должен обеспечить удобный содержательный доступ специалистам в области компьютерной лингвистики, специализирующимся в этой области, к информации об этих методах, включая их реализации, тестовые данные и другие информационные ресурсы по данной тематике.

Жобаның мақсаты мәтіндерді автоматты өңдеудің заманауи әдістері бойынша ғылыми-білім беру қызметін қолдаудың көптілді ақпараттық жүйесін әзірлеу болып табылады, ол осы салада маманданған компьютерлік лингвистика саласындағы мамандарға осы әдістер туралы ақпаратқа, олардың іске асырылуын, тестілік деректерді және тақырып бойынша басқа да ақпараттық ресурстарды қоса алғанда, ыңғайлы мазмұнды қолжетімділікті қамтамасыз етуі тиіс.

При выполнении проекта использовались методы системного анализа, искусственный интеллект (онтологии, семантические сети) и оригинальные авторские подходы, например, авторские методы создания словарей-тезаурусов и онтологий, вывода онтологий, визуализации онтологий и данных, создания эргономичных пользовательских web-интерфейсов на основе онтологий, получения информации из текстов на естественном языке.

Жобаны орындау кезінде жүйелік талдау әдістері, жасанды интеллект (онтология, семантикалық желілер) және түпнұсқа авторлық тәсілдер қолданылды, мысалы, сөздіктер-тезаурустар мен онтологияларды құрудың, онтологияларға қорытынды жасаудың, онтологиялар мен деректерді визуализациялаудың, онтологияларға негізделген эргономикалық пайдаланушы web-интерфейстерін құрудың, табиғи тілдегі мәтіндерден ақпарат алудың авторлық әдістері.

7. Контент информационная система для научно-образовательной деятельности NLP был наполнен информацией о современных методах NLP; 8. Был разработан эргономичный пользовательский web-интерфейс информационная система для научно-образовательной деятельности NLP; 9. Группы экспертов, специализирующихся в области NLP и компьютерной лингвистики, была проведена оценка качества созданного ресурса; Новизна проекта заключается в том, что впервые будет создан масштабный полиязычный ресурс на базе казахского языка, в рамках которого будет осуществлена систематизация информации по классическим и современным методам автоматической обработки текста.

7. Ғылыми-білім беру қызметіне арналған ақпараттық жүйе контенті толтырылды; 8. NLP көмегімен ғылыми-білім беру қызметі үшін ақпараттық жүйенің пайдаланушылық web-интерфейсі әзірленді; 9. Сарапшылар тобының көмегімен құрылған ресурстың сапасы бағаланды. Жобаның жаңалығы қазақ тілі базасында алғаш рет ауқымды көптілді ресурс құрылатын болады, оның шеңберінде мәтінді автоматты өңдеудің классикалық және заманауи әдістері бойынша ақпаратты жүйелеу жүзеге асырылатын болады.

Полученные основные результаты позволят решить задачу поиска информации по всем современным методам NLP и позволят использовать их на практике при проведении национальных исследований в области компьютерной лингвистики и разработке прикладных систем NLP, в которых участвуют государственные и коммерческие организации.

Алынған негізгі нәтижелер барлық заманауи NLP әдістері бойынша ақпаратты іздеу мәселесін шешуге мүмкіндік береді және оларды компьютерлік лингвистика саласындағы ұлттық зерттеулерді жүргізуде және мемлекеттік және коммерциялық ұйымдар қатысатын NLP қолданбалы жүйелерін әзірлеуде тәжірибеде пайдалануға мүмкіндік береді.

Публикации в рецензируемых научных изданиях, апробация результатов исследования на международной конференции

Рецензияланатын ғылыми басылымдар, зерттеу нәтижелерін халықаралық конференцияда апробациялау

календарный план работ на 2022-2024 гг. полностью выполнен.

2022-2024 жж. негізделген күнтізбелік жоспар толық орындалды

Созданная полиязычная информационная система для научно-образовательной деятельности NLP облегчит поиск информации по всем современным методам автоматической обработки текстов и сделает возможным их практическое использование при проведении национальных исследований в области компьютерной лингвистики и разработке прикладных систем автоматической обработки текста, в которых заинтересованы государственные и коммерческие организации.

NLP ғылыми және білім беру қызметі үшін құрылған көптілді ақпараттық жүйе мәтінді автоматты өңдеудің барлық заманауи әдістері туралы ақпаратты іздеуді жеңілдетеді және оларды есептеуіш лингвистика саласындағы ұлттық зерттеулерді жүргізуде және қолданбалы автоматтандыруды әзірлеуде тәжірибеде пайдалануға мүмкіндік береді. Мемлекеттік және коммерциялық ұйымдар қызығушылық танытатын мәтінді өңдеу жүйелері.

UDC indices
УДК 004.9:004.822
International classifier codes
28.23.00; 20.23.25;
Readiness of the development for implementation
Key words in Russian
Информационные ресурсы; Онтология; Содержательный доступ к данным; Методы автоматической обработки текста; Извлечение информации из текста;
Key words in Kazakh
Ақпараттық ресурстар; Онтология; Мәліметтерге мазмұнды қол жеткізу; Мәтінді автоматты өңдеу әдістері; Мәтіннен ақпарат алу;
Head of the organization Мутанов Галимкаир Мутанович Доктор технических наук / профессор
Head of work Садирмекова Жанна Бакирбаевна Доктор философии (PhD) / no
Native executive in charge