Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0321РК00543 | AP09259556-KC-21 | 0121РК00594 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 6 | ||||
International publications: 1 | Publications Web of science: 0 | Publications Scopus: 1 | ||
Patents | Amount of funding | Code of the program | ||
0 | 18586872 | AP09259556 | ||
Name of work | ||||
Разработка методов и систем комплексного обучения и обработки естественного языка на основе технологий искусственного интеллекта | ||||
Type of work | Source of funding | Report authors | ||
Applied | Рахимова Диана Рамазановна | |||
0
0
0
0
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | МНВО РК | |||
Full name of the service recipient | ||||
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК | ||||
Abbreviated name of the service recipient | ИИВТ | |||
Abstract | ||||
Современные технологии обработки и обучения естественного языка. Табиғи тілді өңдеу мен оқытудың заманауи технологиялары. Целью данной работы является не только теоретическая и методологическая работа по исследованию эффективных платформ по обучению, с акцентом на государственный казахский язык, а разработка методов, алгоритмов и инструментальных средств для создания эффективных систем обучения казахскому языку с использованием систем искусственного интеллекта, включая машинный перевод, машинное обучение и распознавание речи. Жұмыстың мақсаты мемлекеттік қазақ тіліне баса назар аудара отырып, оқыту бойынша тиімді платформаларды зерттеу бойынша теориялық және әдіснамалық жұмыс қана емес, машиналық аударма, машиналық оқыту және сөйлеуді тануды қоса алғанда, жасанды интеллект жүйелерін пайдалана отырып, қазақ тілін оқытудың тиімді жүйелерін құру үшін әдістерді, алгоритмдерді және аспаптық құралдарды әзірлеу болып табылады. Модели, методы и программные средства по обработке естественного языка, формальные грамматики, семантический анализ естественного языка,машинное обучение. Формальды грамматика, табиғи тілді өңдеуге және семантикалық талдауға, машиналық оқытуға арналған модельдер, әдістер және бағдарламалық құралдар Изучена существующая литература и доступные онлайн источники по теме исследования. Выбрано и конкретизировано основное направление исследования. Осуществлен аналитический обзор по тематике исследования. Разработан корпус государственного языка. Разработан и применен алгоритм интеллектуального парсинга данных источников для составления электронных словарей и справочников по казахскому языку Разработаны метод и алгоритм выравнивания параллельных текстов (объемом не менее 3 миллиона предложений) для задач построения обучающих систем и систем машинного перевода. Разработанные алгоритмы были проверены практическими экспериментами и оценками качества, и новизна работ апробирована публикациям и докладами на международных конференциях. Зерттеу тақырыбы бойынша бар әдебиеттер мен қолжетімді онлайн дереккөздер зерттеленді. Зерттеудің негізгі бағыты таңдап алынды және нақтыланды. Зерттеу тақырыбы бойынша талдамалық шолу жүзеге асырылды. Мемлекеттік тіл корпусы әзірленді. Қазақ тіліне қатысты электронды сөздіктер мен анықтамалықтар құрастыруға қолданылатын интеллектуалды талдаудың алгоритмі әзірленді Оқыту жүйелері мен машиналық аударма жүйелерін құру міндеттері үшін параллель мәтіндерді (көлемі кемінде 3 миллион сөйлем) теңестіру әдісі мен алгоритмі әзірленді. Әзірленген алгоритмдер тәжірибелік эксперименттермен және сапаны бағалаумен тексерілді және жұмыстардың жаңалығы халықаралық конференцияларда жарияланымдар мен баяндамалармен сынақтан өткізілді. Расходование средств финансирования производится согласно утвержденной смете. Қаражат жұмсауы бекітілген құжатқа сәйкес жүргізіледі.
Потребителями разработанной комплексом обучающей системы будут все слои населения Казахстана, государственные и учебные учреждения, а потребителями научных результатов будут: ученые и исследователи (как в области информатики, так и лингвистики), разработчики, поставщики и конечные пользователи. Әзірлеген кешен оқыту жүйесінің тұтынушылары Қазақстан халқының барлық топтары, мемлекеттік және оқу орындары. Ал ғылыми нәтижелердің тұтынушылары: ғалымдар мен зерттеушілер (информатика және лингвистика саласында ), әзірлеушілер, қарапайым тұтынушылар. |
||||
UDC indices | ||||
004.421,004.912 | ||||
International classifier codes | ||||
20.00.00; 28.23.00; | ||||
Key words in Russian | ||||
компьютерная лингвистика; лингвистический корпус; машинное обучение; машинный перевод; речевые технологий; | ||||
Key words in Kazakh | ||||
компьютерлік лингвистика; лингвистикалық корпус; машиналық оқыту; машиналық аударма; сөйлеу технологиялары; | ||||
Head of the organization | Мутанов Галимкаир Мутанович | Доктор технических наук / профессор | ||
Head of work | Рахимова Диана Рамазановна | PhD / Ассоциированный профессор |