Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0323РК01542 | AP13268833-KC-23 | 0122РК00126 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 0 | ||||
International publications: 0 | Publications Web of science: 0 | Publications Scopus: 0 | ||
Patents | Amount of funding | Code of the program | ||
0 | 7986986.2 | AP13268833 | ||
Name of work | ||||
Исследование и разработка методов и алгоритмов интеллектуальной обработки латинографических текстов на казахском языке | ||||
Type of work | Source of funding | Report authors | ||
Applied | Икласова Кайнижамал Есимсеитовна | |||
0
0
0
0
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | МНВО РК | |||
Full name of the service recipient | ||||
Некоммерческое акционерное общество "Северо-Казахстанский университет имени Манаша Козыбаева" | ||||
Abbreviated name of the service recipient | СКУ им. М. Козыбаева | |||
Abstract | ||||
Объектом исследования является формы и методы представления естественного (казахского) языка на латинице Зерттеу нысаны латын тілінде табиғи (қазақ) тілді ұсынудың формалары мен әдістері болып табылады Целью проекта является исследование существующих и разработка новых методов и алгоритмов интеллектуальной обработки данных, а именно латинографического текста на казахском языке для эффективного управления процессом перехода на латиницу. Жобаның мақсаты-латын әліпбиіне көшу процесін тиімді басқару үшін деректерді, атап айтқанда, қазақ тіліндегі латинографиялық мәтінді зияткерлік өңдеудің жаңа әдістері мен алгоритмдерін зерттеу және әзірлеу Системный анализ, моделирование и методы классификации, обработки статистической информации, формализация и алгоритмизации. Методы сбора первичной информации - сбор и фильтрация данных из различных источников, анализ естественно-языковых данных. Жүйелік талдау, модельдеу және жіктеу әдістері, ақпаратты статистикалық өңдеу, формализация және Алгоритмдеу. Бастапқы ақпаратты жинау әдістері-әртүрлі көздерден деректерді жинау және сүзу, табиғи тілдегі деректерді талдау. Была проведена исследовательская работа по формированию подкорпуса казахского языка на латинице. Была разработана и оформлена к печати вторая глава монографии. Исследовательская работа включала анализ возможности применения действующих корпусов языка для формирования новых терминологических словарей, анализ современного программного обеспечения для разработки подкорпуса языка на латинской графике, проектирование способа (метода и алгоритма) исследования по формированию терминологического словаря. Результаты оформлены в виде второй главы монографии. Исследованы и разработаны алгоритмы и методы с использованием машинного обучения для семантического анализа коротких казахских текстов на латинице. Проведен эксперимент с использованием готовых решений для семантического анализа. Результаты оформлены в виде научной статьи и готовятся к отправлению в рецензируемый научное издание, индексируемое в базе Scopus. Латын әліпбиінде қазақ тілін қалыптастыру бойынша зерттеу жұмыстары жүргізілді. Монографияның екінші тарауы әзірленіп, баспаға шығарылды. Зерттеу жұмысы жаңа терминологиялық сөздіктерді қалыптастыру үшін қолданыстағы Тіл корпустарын қолдану мүмкіндігін талдауды, латын графикасында тілдің кіші корпусын әзірлеуге арналған заманауи бағдарламалық жасақтаманы талдауды, терминологиялық сөздікті қалыптастыру бойынша зерттеу әдісін (әдісі мен алгоритмін) жобалауды қамтыды. Нәтижелер монографияның екінші тарауы түрінде берілген. Латын әліпбиіндегі қысқа қазақ мәтіндерін семантикалық талдау үшін машиналық оқытуды пайдалана отырып, алгоритмдер мен әдістер зерттелді және әзірленді. Семантикалық талдау үшін дайын шешімдерді қолдана отырып эксперимент жүргізілді. Нәтижелер ғылыми мақала түрінде ресімделіп, Scopus базасында индекстелетін рецензияланатын ғылыми басылымға жіберуге дайындалуда. Была разработана и оформлена к печати вторая глава монографии. Результаты оформлены в виде научной статьи и готовятся к отправлению в рецензируемый научное издание, индексируемое в базе Scopus. Монографияның екінші тарауы әзірленіп, баспаға шығарылды. Нәтижелер ғылыми мақала түрінде ресімделіп, Scopus базасында индекстелетін рецензияланатын ғылыми басылымға жіберуге дайындалуда. Была разработана и оформлена к печати вторая глава монографии. Результаты оформлены в виде научной статьи и готовятся к отправлению в рецензируемый научное издание, индексируемое в базе Scopus. Монографияның екінші тарауы әзірленіп, баспаға шығарылды. Нәтижелер ғылыми мақала түрінде ресімделіп, Scopus базасында индекстелетін рецензияланатын ғылыми басылымға жіберуге дайындалуда. Эффективность заключается в улучшении сбора и обработки информации Тиімділік ақпаратты жинау мен өңдеуді жақсарту болып табылады Разработка цифровых ресурсов Сандық ресурстарды қрастыру саласында |
||||
UDC indices | ||||
004 | ||||
International classifier codes | ||||
20.00.00; | ||||
Key words in Russian | ||||
Компьютерная лингвистика; Интеллектуальная обработка данных; Естественный язык; Латиница; Алфавит; | ||||
Key words in Kazakh | ||||
Компьютерлік лингвистика; Деректерді интеллектуалды өңдеу; Табиғи тіл; Латын; Әліпбиі; | ||||
Head of the organization | Апергенова Рената Сеитовна | / | ||
Head of work | Икласова Кайнижамал Есимсеитовна | Phd / нет |