Inventory number IRN Number of state registration
0325РК01981 AP26105015-KC-25 0125РК00749
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 1
International publications: 0 Publications Web of science: 0 Publications Scopus: 0
Patents Amount of funding Code of the program
0 29940890 AP26105015
Name of work
Трансмиссия этнокультурных единиц в системе искусственного интеллекта: языковые девиации и ее систематизация
Type of work Source of funding Report authors
Fundamental Рысқұлбек Дидар Жылқыбайқызы
0
1
2
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Некоммерческое акционерное общество "Казахский национальный женский педагогический университет"
Abbreviated name of the service recipient КазНацЖенПУ
Abstract

Использование и перевод этнокультурных единиц казахского языка в системах искусственного интеллекта

Жасанды интеллект жүйелеріндегі қазақ тіліндегі этномәдени бірліктердің қолданысы мен аударылуы

выявить и систематизировать этнокультурные единицы (фразеологизмы, лингвокультурализмы, лексико-паремиологические единицы, метафоры), вызывающие трудности при машинном переводе и интерпретации.

Машиналық аударма мен түсіндіруде қиындықтар туғызатын этномәдени бірліктерді (фразеологизмдер, лингвокультуремалар, лексикалық және паремиологиялық бірліктер, метафоралар) анықтау және жүйелеу

Описательное исследование, корреляционные исследования, экспериментальное исследование, методы сравнительного анализа, анкетирование, интервью, метод моделирования когнитивных процессов

Сипаттамалық зерттеу, корреляциялық зерттеулер, эксперименттік зерттеу, салыстырмалы талдау әдісі, сауалнама, сұхбат, когнитивтік процестерді модельдеу әдістері

Проведен обзор исследований отечественных и зарубежных ученых по теме исследования, их анализ и систематизация. Собрано 500 этнокультурных единиц с высокой употребительностью в казахском языке, проведен лексико-семантический, прагматико-стилистический анализ и выполнена тематическая группировка. Проведен научный семинар для выявления проблем исследования. Проведен анализ текущего перевода этнокультурных единиц в системах Google, Yandex, chat gpt и др. Выявлены и систематизированы ошибки при переводе этнокультурных единиц. Результаты опубликованы в 1 статье на международной конференции. Проведены консультации с отечественными IT-специалистами по вопросам повышения качества перевода, а также ознакомление с механизмом передачи этнокультурных единиц в системах искусственного интеллекта.

Зерттеу тақырыбына арналған отандық, әлемдік ғалымдардың зерттеулеріне шолу жасалды, талданды, жүйеленді. Қазақ тіліндегі қолданылуы жоғары 500 этномәдени бірліктер жиналып, лексика-семантикалық, прагматикалық-стилистикалық талдау жасалды, тақырыптық топтастырылды. Зерттеу мәселелерін айқындау мақсатында ғылыми семинар өткізілді. Google, Яндекс, chat gpt т.т. жүйелеріндегі этномәдени бірліктердің қазіргі аудармасына талдау жасалды. Этномәдени бірліктердің аударылуындағы қателіктер анықталып, жүйеленді. Нәтижелері халықаралық конференцияда 1 мақала болып жарияланды. Аударма сапасын жетілдіру бойынша отандық ІТ саласының мамандарынан кеңес алынып, жасанды интеллект жүйесіндегі этномәдени бірліктердің берілу механизмімен таныстық.

Основные конструктивные показатели исследования – объём корпуса казахоязычных этнокультурных единиц, их переводы на три языка и разработка системы мета-разметки, а также создание онлайн-словаря и базы данных. Технико-экономические показатели – объём необходимых трудовых и технических ресурсов для реализации проекта, затраты на цифровую инфраструктуру и экономическая эффективность, достигаемая за счёт повышения качества обработки казахского языка в системах искусственного интеллекта.

Зерттеудің негізгі конструктивтік көрсеткіштері – қазақ тіліндегі этномәдени бірліктер корпусының көлемі, олардың үш тілдегі аудармалары мен мета-белгіленім жүйесінің әзірленуі, сондай-ақ онлайн сөздік пен деректер базасының жасалуы. Техникалық-экономикалық көрсеткіштері – жобаны іске асыруға қажетті еңбек және техникалық ресурстардың көлемі, цифрлық инфрақұрылым шығындары және жасанды интеллект жүйелерінде қазақ тілін өңдеу сапасын арттыру арқылы алынатын экономикалық тиімділік.

Степень внедрения результатов исследования характеризуется представлением собранного корпуса этнокультурных единиц и анализа их переводов научному сообществу, публикацией результатов на международной конференции, а также определением первоначальных механизмов интеграции в системы искусственного интеллекта на основе проведённых консультаций с отечественными IT-специалистами.

Зерттеу нәтижелерінің енгізу дәрежесі – жиналған этномәдени бірліктер корпусы мен олардың аудармасына жасалған талдау ғылыми қауымдастыққа ұсынылып, халықаралық конференцияда жариялануы және ІТ мамандарымен жүргізілген кеңестер негізінде жасанды интеллект жүйелеріне енгізуге бағытталған бастапқы механизмдердің айқындалуымен сипатталады.

Эффективность исследования заключается в повышении точности обработки казахского языка на платформах искусственного интеллекта, снижении ошибок машинного перевода и укреплении конкурентоспособности казахского языка в цифровом пространстве за счёт разработки лингвистической базы и системы мета-разметки, обеспечивающих качественный перевод этнокультурных единиц. Кроме того, результаты исследования находят практическое применение в сфере образования, межкультурной коммуникации, ИТ и контент-индустрии, способствуя международному признанию казахского языка.

Зерттеу тиімділігі – қазақ тіліндегі этномәдени бірліктердің сапалы аударылуын қамтамасыз ететін лингвистикалық база мен мета-белгіленім жүйесін әзірлеу арқылы жасанды интеллект платформаларында қазақ тілін өңдеу дәлдігін арттыру, машиналық аудармадағы қателерді азайту және қазақ тілінің цифрлық кеңістіктегі бәсекеге қабілеттілігін күшейту. Сонымен қатар, зерттеу нәтижелері білім беру, мәдениетаралық коммуникация, ІТ және контент индустриясы салаларында практикалық қолдануға ие болып, қазақ тілінің халықаралық деңгейде танылуына ықпал етеді.

гуманитарные науки и искусство, язык и литература, образование

гуманитарлық ғылымдар және өнер, тіл және әдебиет, білім беру

UDC indices
004.8:81'33:81’42
International classifier codes
16.01.11;
Key words in Russian
Этнокультурное единство; искусственный интеллект; межкультурное общение; трансляционная эрратология; контекстуальное значение; трехъязычный словарь;
Key words in Kazakh
Этномәдени бірлік; жасанды интеллект; мәдениетаралық коммуникация; аударма эрратологиясы; контекстік мағына; үш тілді сөздік;
Head of the organization Суатай Сәбит Құрманжанұлы Кандидат филологических наук / доцент
Head of work Рысқұлбек Дидар Жылқыбайқызы Phd / жоқ