Inventory number IRN Number of state registration
0321РК00543 AP09259556-KC-21 0121РК00594
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 6
International publications: 1 Publications Web of science: 0 Publications Scopus: 1
Patents Amount of funding Code of the program
0 18586872 AP09259556
Name of work
Разработка методов и систем комплексного обучения и обработки естественного языка на основе технологий искусственного интеллекта
Type of work Source of funding Report authors
Applied Рахимова Диана Рамазановна
0
0
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Abbreviated name of the service recipient ИИВТ
Abstract

Современные технологии обработки и обучения естественного языка.

Табиғи тілді өңдеу мен оқытудың заманауи технологиялары.

Целью данной работы является не только теоретическая и методологическая работа по исследованию эффективных платформ по обучению, с акцентом на государственный казахский язык, а разработка методов, алгоритмов и инструментальных средств для создания эффективных систем обучения казахскому языку с использованием систем искусственного интеллекта, включая машинный перевод, машинное обучение и распознавание речи.

Жұмыстың мақсаты мемлекеттік қазақ тіліне баса назар аудара отырып, оқыту бойынша тиімді платформаларды зерттеу бойынша теориялық және әдіснамалық жұмыс қана емес, машиналық аударма, машиналық оқыту және сөйлеуді тануды қоса алғанда, жасанды интеллект жүйелерін пайдалана отырып, қазақ тілін оқытудың тиімді жүйелерін құру үшін әдістерді, алгоритмдерді және аспаптық құралдарды әзірлеу болып табылады.

Модели, методы и программные средства по обработке естественного языка, формальные грамматики, семантический анализ естественного языка,машинное обучение.

Формальды грамматика, табиғи тілді өңдеуге және семантикалық талдауға, машиналық оқытуға арналған модельдер, әдістер және бағдарламалық құралдар

Изучена существующая литература и доступные онлайн источники по теме исследования. Выбрано и конкретизировано основное направление исследования. Осуществлен аналитический обзор по тематике исследования. Разработан корпус государственного языка. Разработан и применен алгоритм интеллектуального парсинга данных источников для составления электронных словарей и справочников по казахскому языку Разработаны метод и алгоритм выравнивания параллельных текстов (объемом не менее 3 миллиона предложений) для задач построения обучающих систем и систем машинного перевода. Разработанные алгоритмы были проверены практическими экспериментами и оценками качества, и новизна работ апробирована публикациям и докладами на международных конференциях.

Зерттеу тақырыбы бойынша бар әдебиеттер мен қолжетімді онлайн дереккөздер зерттеленді. Зерттеудің негізгі бағыты таңдап алынды және нақтыланды. Зерттеу тақырыбы бойынша талдамалық шолу жүзеге асырылды. Мемлекеттік тіл корпусы әзірленді. Қазақ тіліне қатысты электронды сөздіктер мен анықтамалықтар құрастыруға қолданылатын интеллектуалды талдаудың алгоритмі әзірленді Оқыту жүйелері мен машиналық аударма жүйелерін құру міндеттері үшін параллель мәтіндерді (көлемі кемінде 3 миллион сөйлем) теңестіру әдісі мен алгоритмі әзірленді. Әзірленген алгоритмдер тәжірибелік эксперименттермен және сапаны бағалаумен тексерілді және жұмыстардың жаңалығы халықаралық конференцияларда жарияланымдар мен баяндамалармен сынақтан өткізілді.

Расходование средств финансирования производится согласно утвержденной смете.

Қаражат жұмсауы бекітілген құжатқа сәйкес жүргізіледі.

Потребителями разработанной комплексом обучающей системы будут все слои населения Казахстана, государственные и учебные учреждения, а потребителями научных результатов будут: ученые и исследователи (как в области информатики, так и лингвистики), разработчики, поставщики и конечные пользователи.

Әзірлеген кешен оқыту жүйесінің тұтынушылары Қазақстан халқының барлық топтары, мемлекеттік және оқу орындары. Ал ғылыми нәтижелердің тұтынушылары: ғалымдар мен зерттеушілер (информатика және лингвистика саласында ), әзірлеушілер, қарапайым тұтынушылар.

UDC indices
004.421,004.912
International classifier codes
20.00.00; 28.23.00;
Key words in Russian
компьютерная лингвистика; лингвистический корпус; машинное обучение; машинный перевод; речевые технологий;
Key words in Kazakh
компьютерлік лингвистика; лингвистикалық корпус; машиналық оқыту; машиналық аударма; сөйлеу технологиялары;
Head of the organization Мутанов Галимкаир Мутанович Доктор технических наук / профессор
Head of work Рахимова Диана Рамазановна PhD / нет