Inventory number IRN Number of state registration
0323РК01542 AP13268833-KC-23 0122РК00126
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 0 Publications Web of science: 0 Publications Scopus: 0
Patents Amount of funding Code of the program
0 7986986.2 AP13268833
Name of work
Исследование и разработка методов и алгоритмов интеллектуальной обработки латинографических текстов на казахском языке
Type of work Source of funding Report authors
Applied Икласова Кайнижамал Есимсеитовна
0
0
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Некоммерческое акционерное общество "Северо-Казахстанский университет имени Манаша Козыбаева"
Abbreviated name of the service recipient СКУ им. М. Козыбаева
Abstract

Объектом исследования является формы и методы представления естественного (казахского) языка на латинице

Зерттеу нысаны латын тілінде табиғи (қазақ) тілді ұсынудың формалары мен әдістері болып табылады

Целью проекта является исследование существующих и разработка новых методов и алгоритмов интеллектуальной обработки данных, а именно латинографического текста на казахском языке для эффективного управления процессом перехода на латиницу.

Жобаның мақсаты-латын әліпбиіне көшу процесін тиімді басқару үшін деректерді, атап айтқанда, қазақ тіліндегі латинографиялық мәтінді зияткерлік өңдеудің жаңа әдістері мен алгоритмдерін зерттеу және әзірлеу

Системный анализ, моделирование и методы классификации, обработки статистической информации, формализация и алгоритмизации. Методы сбора первичной информации - сбор и фильтрация данных из различных источников, анализ естественно-языковых данных.

Жүйелік талдау, модельдеу және жіктеу әдістері, ақпаратты статистикалық өңдеу, формализация және Алгоритмдеу. Бастапқы ақпаратты жинау әдістері-әртүрлі көздерден деректерді жинау және сүзу, табиғи тілдегі деректерді талдау.

Была проведена исследовательская работа по формированию подкорпуса казахского языка на латинице. Была разработана и оформлена к печати вторая глава монографии. Исследовательская работа включала анализ возможности применения действующих корпусов языка для формирования новых терминологических словарей, анализ современного программного обеспечения для разработки подкорпуса языка на латинской графике, проектирование способа (метода и алгоритма) исследования по формированию терминологического словаря. Результаты оформлены в виде второй главы монографии. Исследованы и разработаны алгоритмы и методы с использованием машинного обучения для семантического анализа коротких казахских текстов на латинице. Проведен эксперимент с использованием готовых решений для семантического анализа. Результаты оформлены в виде научной статьи и готовятся к отправлению в рецензируемый научное издание, индексируемое в базе Scopus.

Латын әліпбиінде қазақ тілін қалыптастыру бойынша зерттеу жұмыстары жүргізілді. Монографияның екінші тарауы әзірленіп, баспаға шығарылды. Зерттеу жұмысы жаңа терминологиялық сөздіктерді қалыптастыру үшін қолданыстағы Тіл корпустарын қолдану мүмкіндігін талдауды, латын графикасында тілдің кіші корпусын әзірлеуге арналған заманауи бағдарламалық жасақтаманы талдауды, терминологиялық сөздікті қалыптастыру бойынша зерттеу әдісін (әдісі мен алгоритмін) жобалауды қамтыды. Нәтижелер монографияның екінші тарауы түрінде берілген. Латын әліпбиіндегі қысқа қазақ мәтіндерін семантикалық талдау үшін машиналық оқытуды пайдалана отырып, алгоритмдер мен әдістер зерттелді және әзірленді. Семантикалық талдау үшін дайын шешімдерді қолдана отырып эксперимент жүргізілді. Нәтижелер ғылыми мақала түрінде ресімделіп, Scopus базасында индекстелетін рецензияланатын ғылыми басылымға жіберуге дайындалуда.

Была разработана и оформлена к печати вторая глава монографии. Результаты оформлены в виде научной статьи и готовятся к отправлению в рецензируемый научное издание, индексируемое в базе Scopus.

Монографияның екінші тарауы әзірленіп, баспаға шығарылды. Нәтижелер ғылыми мақала түрінде ресімделіп, Scopus базасында индекстелетін рецензияланатын ғылыми басылымға жіберуге дайындалуда.

Была разработана и оформлена к печати вторая глава монографии. Результаты оформлены в виде научной статьи и готовятся к отправлению в рецензируемый научное издание, индексируемое в базе Scopus.

Монографияның екінші тарауы әзірленіп, баспаға шығарылды. Нәтижелер ғылыми мақала түрінде ресімделіп, Scopus базасында индекстелетін рецензияланатын ғылыми басылымға жіберуге дайындалуда.

Эффективность заключается в улучшении сбора и обработки информации

Тиімділік ақпаратты жинау мен өңдеуді жақсарту болып табылады

Разработка цифровых ресурсов

Сандық ресурстарды қрастыру саласында

UDC indices
004
International classifier codes
20.00.00;
Key words in Russian
Компьютерная лингвистика; Интеллектуальная обработка данных; Естественный язык; Латиница; Алфавит;
Key words in Kazakh
Компьютерлік лингвистика; Деректерді интеллектуалды өңдеу; Табиғи тіл; Латын; Әліпбиі;
Head of the organization Апергенова Рената Сеитовна /
Head of work Икласова Кайнижамал Есимсеитовна Phd / нет