Inventory number | IRN | Number of state registration |
---|---|---|
0224РК00849 | AP14972834-OT-24 | 0122РК00787 |
Document type | Terms of distribution | Availability of implementation |
Заключительный | Gratis | Number of implementation: 0 Not implemented |
Publications | ||
Native publications: 2 | ||
International publications: 1 | Publications Web of science: 0 | Publications Scopus: 0 |
Number of books | Appendicies | Sources |
1 | 3 | 47 |
Total number of pages | Patents | Illustrations |
70 | 0 | 16 |
Amount of funding | Code of the program | Table |
7973137 | AP14972834 | 1 |
Name of work | ||
Разработка полиязычной информационной системы для научно-образовательной деятельности с применением NLP | ||
Report title | ||
Type of work | Source of funding | The product offerred for implementation |
Applied | Модель | |
Report authors | ||
Садирмекова Жанна Бакирбаевна , Самбетбаева Мадина Аралбаевна , | ||
0
0
0
0
|
||
Customer | МНВО РК | |
Information on the executing organization | ||
Short name of the ministry (establishment) | МНВО РК | |
Full name of the service recipient | ||
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК | ||
Abbreviated name of the service recipient | ИИВТ | |
Abstract | ||
Объектом исследования в данной работе является процесс разработки автоматизированного наполнения контента информационной системы для научно-образовательной деятельности NLP. Бұл жұмыстағы зерттеу объектісі NLP ғылыми-білім беру қызметі үшін ақпараттық жүйенің мазмұнын автоматтандырылған толтыруды әзірлеу процесі болып табылады. Целью проекта является разработка полиязычной информационной системы поддержки научно- образовательной деятельности по современным методам автоматической обработки текстов, который должен обеспечить удобный содержательный доступ специалистам в области компьютерной лингвистики, специализирующимся в этой области, к информации об этих методах, включая их реализации, тестовые данные и другие информационные ресурсы по данной тематике. Жобаның мақсаты мәтіндерді автоматты өңдеудің заманауи әдістері бойынша ғылыми-білім беру қызметін қолдаудың көптілді ақпараттық жүйесін әзірлеу болып табылады, ол осы салада маманданған компьютерлік лингвистика саласындағы мамандарға осы әдістер туралы ақпаратқа, олардың іске асырылуын, тестілік деректерді және тақырып бойынша басқа да ақпараттық ресурстарды қоса алғанда, ыңғайлы мазмұнды қолжетімділікті қамтамасыз етуі тиіс. При выполнении проекта использовались методы системного анализа, искусственный интеллект (онтологии, семантические сети) и оригинальные авторские подходы, например, авторские методы создания словарей-тезаурусов и онтологий, вывода онтологий, визуализации онтологий и данных, создания эргономичных пользовательских web-интерфейсов на основе онтологий, получения информации из текстов на естественном языке. Жобаны орындау кезінде жүйелік талдау әдістері, жасанды интеллект (онтология, семантикалық желілер) және түпнұсқа авторлық тәсілдер қолданылды, мысалы, сөздіктер-тезаурустар мен онтологияларды құрудың, онтологияларға қорытынды жасаудың, онтологиялар мен деректерді визуализациялаудың, онтологияларға негізделген эргономикалық пайдаланушы web-интерфейстерін құрудың, табиғи тілдегі мәтіндерден ақпарат алудың авторлық әдістері. 7. Контент информационная система для научно-образовательной деятельности NLP был наполнен информацией о современных методах NLP; 8. Был разработан эргономичный пользовательский web-интерфейс информационная система для научно-образовательной деятельности NLP; 9. Группы экспертов, специализирующихся в области NLP и компьютерной лингвистики, была проведена оценка качества созданного ресурса; Новизна проекта заключается в том, что впервые будет создан масштабный полиязычный ресурс на базе казахского языка, в рамках которого будет осуществлена систематизация информации по классическим и современным методам автоматической обработки текста. 7. Ғылыми-білім беру қызметіне арналған ақпараттық жүйе контенті толтырылды; 8. NLP көмегімен ғылыми-білім беру қызметі үшін ақпараттық жүйенің пайдаланушылық web-интерфейсі әзірленді; 9. Сарапшылар тобының көмегімен құрылған ресурстың сапасы бағаланды. Жобаның жаңалығы қазақ тілі базасында алғаш рет ауқымды көптілді ресурс құрылатын болады, оның шеңберінде мәтінді автоматты өңдеудің классикалық және заманауи әдістері бойынша ақпаратты жүйелеу жүзеге асырылатын болады. Полученные основные результаты позволят решить задачу поиска информации по всем современным методам NLP и позволят использовать их на практике при проведении национальных исследований в области компьютерной лингвистики и разработке прикладных систем NLP, в которых участвуют государственные и коммерческие организации. Алынған негізгі нәтижелер барлық заманауи NLP әдістері бойынша ақпаратты іздеу мәселесін шешуге мүмкіндік береді және оларды компьютерлік лингвистика саласындағы ұлттық зерттеулерді жүргізуде және мемлекеттік және коммерциялық ұйымдар қатысатын NLP қолданбалы жүйелерін әзірлеуде тәжірибеде пайдалануға мүмкіндік береді. Публикации в рецензируемых научных изданиях, апробация результатов исследования на международной конференции Рецензияланатын ғылыми басылымдар, зерттеу нәтижелерін халықаралық конференцияда апробациялау календарный план работ на 2022-2024 гг. полностью выполнен. 2022-2024 жж. негізделген күнтізбелік жоспар толық орындалды Созданная полиязычная информационная система для научно-образовательной деятельности NLP облегчит поиск информации по всем современным методам автоматической обработки текстов и сделает возможным их практическое использование при проведении национальных исследований в области компьютерной лингвистики и разработке прикладных систем автоматической обработки текста, в которых заинтересованы государственные и коммерческие организации. NLP ғылыми және білім беру қызметі үшін құрылған көптілді ақпараттық жүйе мәтінді автоматты өңдеудің барлық заманауи әдістері туралы ақпаратты іздеуді жеңілдетеді және оларды есептеуіш лингвистика саласындағы ұлттық зерттеулерді жүргізуде және қолданбалы автоматтандыруды әзірлеуде тәжірибеде пайдалануға мүмкіндік береді. Мемлекеттік және коммерциялық ұйымдар қызығушылық танытатын мәтінді өңдеу жүйелері. |
||
UDC indices | ||
УДК 004.9:004.822 | ||
International classifier codes | ||
28.23.00; 20.23.25; | ||
Readiness of the development for implementation | ||
Key words in Russian | ||
Информационные ресурсы; Онтология; Содержательный доступ к данным; Методы автоматической обработки текста; Извлечение информации из текста; | ||
Key words in Kazakh | ||
Ақпараттық ресурстар; Онтология; Мәліметтерге мазмұнды қол жеткізу; Мәтінді автоматты өңдеу әдістері; Мәтіннен ақпарат алу; | ||
Head of the organization | Мутанов Галимкаир Мутанович | Доктор технических наук / профессор |
Head of work | Садирмекова Жанна Бакирбаевна | Доктор философии (PhD) / no |
Native executive in charge |