Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0323РК00225 | AP14972834-KC-23 | 0122РК00787 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 0 | ||||
International publications: 3 | Publications Web of science: 0 | Publications Scopus: 3 | ||
Patents | Amount of funding | Code of the program | ||
0 | 7953237 | AP14972834 | ||
Name of work | ||||
Разработка полиязычной информационной системы для научно-образовательной деятельности с применением NLP | ||||
Type of work | Source of funding | Report authors | ||
Applied | Садирмекова Жанна Бакирбаевна | |||
0
0
0
0
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | МНВО РК | |||
Full name of the service recipient | ||||
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК | ||||
Abbreviated name of the service recipient | ИИВТ | |||
Abstract | ||||
Объектом исследования в данной работе является процесс разработки автоматизированного наполнения контента информационной системы для научно-образовательной деятельности NLP. Бұл жұмыстағы зерттеу объектісі NLP ғылыми-білім беру қызметі үшін ақпараттық жүйенің мазмұнын автоматтандырылған толтыруды әзірлеу процесі болып табылады. Целью проекта является разработка полиязычной информационной системы поддержки научно- образовательной деятельности по современным методам автоматической обработки текстов, который должен обеспечить удобный содержательный доступ специалистам в области компьютерной лингвистики, специализирующимся в этой области, к информации об этих методах, включая их реализации, тестовые данные и другие информационные ресурсы по данной тематике. Жобаның мақсаты мәтіндерді автоматты өңдеудің заманауи әдістері бойынша ғылыми-білім беру қызметін қолдаудың көптілді ақпараттық жүйесін әзірлеу болып табылады, ол осы салада маманданған компьютерлік лингвистика саласындағы мамандарға осы әдістер туралы ақпаратқа, олардың іске асырылуын, тестілік деректерді және тақырып бойынша басқа да ақпараттық ресурстарды қоса алғанда, ыңғайлы мазмұнды қолжетімділікті қамтамасыз етуі тиіс. При выполнении проекта использовались методы системного анализа, искусственный интеллект (онтологии, семантические сети) и оригинальные авторские подходы, например, авторские методы создания словарей-тезаурусов и онтологий, вывода онтологий, визуализации онтологий и данных, создания эргономичных пользовательских web-интерфейсов на основе онтологий, получения информации из текстов на естественном языке. Жобаны орындау кезінде жүйелік талдау әдістері, жасанды интеллект (онтология, семантикалық желілер) және түпнұсқа авторлық тәсілдер қолданылды, мысалы, сөздіктер-тезаурустар мен онтологияларды құрудың, онтологияларға қорытынды жасаудың, онтологиялар мен деректерді визуализациялаудың, онтологияларға негізделген эргономикалық пайдаланушы web-интерфейстерін құрудың, табиғи тілдегі мәтіндерден ақпарат алудың авторлық әдістері. 3. Формализована система понятий предметной области NLP, которая составила терминологическое ядро онтологии NLP. 4. Разработаны новые методы автоматического извлечения названий сущностей онтологии из текстов на естественном языке. Были проведены экспериментальное исследование предложенных методов на текстах научных публикации по NLP. 5. Разработана хранилище данных информационной системы для научно-образовательной деятельности NLP. 6. Разработана средства автоматизированного наполнения контента информационной системы для научно-образовательной деятельности NLP. Новизна проекта заключается в том, что впервые будет создан масштабный полиязычный ресурс на базе казахского языка, в рамках которого будет осуществлена систематизация информации по классическим и современным методам автоматической обработки текста. 3. Онтологияның терминологиялық өзегін құру мақсатында NLP пәндік саласы ұғымдарының жүйесін бір жобаға келтіру жұмыстары жүзеге асырылды. 4. Табиғи тілдегі мәтіндерден онтология нысандарының атауларын автоматты түрде алу әдістері жасалды. NLP бойынша ғылыми жарияланымдардың мәтіндерінде ұсынылған әдістерге эксперименттік зерттеу жүргізілді. 5. NLP ғылыми және білім беру қызметі үшін құрылған ақпараттық жүйенің деректер қоймасын әзірленді. 6. NLP ғылыми және білім беру қызметі үшін құрылған ақпараттық жүйе контентінің мазмұнын толтыру жұмыстары жасалады. Жобаның жаңалығы қазақ тілі базасында алғаш рет ауқымды көптілді ресурс құрылатын болады, оның шеңберінде мәтінді автоматты өңдеудің классикалық және заманауи әдістері бойынша ақпаратты жүйелеу жүзеге асырылатын болады. Полученные основные результаты позволят решить задачу поиска информации по всем современным методам NLP и позволят использовать их на практике при проведении национальных исследований в области компьютерной лингвистики и разработке прикладных систем NLP, в которых участвуют государственные и коммерческие организации. Алынған негізгі нәтижелер барлық заманауи NLP әдістері бойынша ақпаратты іздеу мәселесін шешуге мүмкіндік береді және оларды компьютерлік лингвистика саласындағы ұлттық зерттеулерді жүргізуде және мемлекеттік және коммерциялық ұйымдар қатысатын NLP қолданбалы жүйелерін әзірлеуде тәжірибеде пайдалануға мүмкіндік береді. На стадии разработки Өңделу кезеңінде
Созданная полиязычная информационная система для научно-образовательной деятельности NLP облегчит поиск информации по всем современным методам автоматической обработки текстов и сделает возможным их практическое использование при проведении национальных исследований в области компьютерной лингвистики и разработке прикладных систем автоматической обработки текста, в которых заинтересованы государственные и коммерческие организации. NLP ғылыми және білім беру қызметі үшін құрылған көптілді ақпараттық жүйе мәтінді автоматты өңдеудің барлық заманауи әдістері туралы ақпаратты іздеуді жеңілдетеді және оларды есептеуіш лингвистика саласындағы ұлттық зерттеулерді жүргізуде және қолданбалы автоматтандыруды әзірлеуде тәжірибеде пайдалануға мүмкіндік береді. Мемлекеттік және коммерциялық ұйымдар қызығушылық танытатын мәтінді өңдеу жүйелері. |
||||
UDC indices | ||||
УДК 004.9:004.822 | ||||
International classifier codes | ||||
28.23.00; 20.23.25; | ||||
Key words in Russian | ||||
Информационные ресурсы; Онтология; Содержательный доступ к данным; Методы автоматической обработки текста; Извлечение информации из текста; | ||||
Key words in Kazakh | ||||
Ақпараттық ресурстар; Онтология; Мәліметтерге мазмұнды қол жеткізу; Мәтінді автоматты өңдеу әдістері; Мәтіннен ақпарат алу; | ||||
Head of the organization | Мутанов Галимкаир Мутанович | Доктор технических наук / профессор | ||
Head of work | Садирмекова Жанна Бакирбаевна | Доктор философии (PhD) / no |