Inventory number IRN Number of state registration
0225РК00682 AP19676988-OT-25 0123РК00917
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 1
Implemented
Publications
Native publications: 2
International publications: 3 Publications Web of science: 0 Publications Scopus: 1
Number of books Appendicies Sources
1 2 149
Total number of pages Patents Illustrations
241 0 0
Amount of funding Code of the program Table
23380800 AP19676988 39
Name of work
Конкорданс А.Байтурсынова. Казахско-русский параллельный корпус
Report title
Type of work Source of funding The product offerred for implementation
Applied Другая (укажите)
Report authors
Байшукурова Гулнур Жолаушыбаевна , Аитова Нурлыхан Нуруллаевна , Иргебаева Акерке Баяновна , Серикова Самал Каиржановна , Умарова Акмарал Базархановна ,
0
0
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
НАО "Казахский национальный педагогический университет имени Абая"
Abbreviated name of the service recipient НАО "КазНПУ им.Абая"
Abstract

Казахско-русский параллельный корпус, созданный на основе произведений Ахмета Байтурсынулы, и особенности репрезентации в нём языковых единиц.

Ахмет Байтұрсынұлының шығармалары негізінде құрылған қазақ-орыс параллель корпусы және ондағы тілдік бірліктердің қолданысы.

Представить полный алфавитно-частотный конкорданс к текстам А.Байтурсынуды на двух языках (казахском и русском), цифровую версию байтурсыновской системы терминологии, своеобразие ее функционирования в трудах автора на основе параллельных (двуязычных) корпусов избранных сочинений А.Байтурсынулы.

А.Байтұрсыновтың екі тілдегі (қазақ және орыс) мәтіндеріне толық әліпбилік-жиілік конкордансын, Байтұрсынов терминология жүйесінің цифрлық нұсқасын, А. Байтұрсыновтың таңдаулы шығармаларының параллель (екі тілді) корпустары негізінде автордың еңбектерінде оның жұмыс істеу ерекшелігін ұсыну.

Методы исследования: корпусный анализ текста (конкордансы, частотность, лемматизация); метод сплошной выборки; цифровые и статистические методы обработки языковых единиц.

Зерттеу әдістері: мәтінді корпустық талдау (үйлестіру, жиілік, лемматизация); үздіксіз іріктеу әдісі; тілдік бірліктерді өңдеудің сандық және статистикалық әдістері.

Составлен казахско-русский алфавитный указатель избранных сочинений и список всех слов, встречающихся в основном тексте сочинений А.Байтурсынова. Составлен казахско-русский параллельный корпус А. Байтурсынулы, проведена морфологическая разметка текстов. Составлена картотека словоупотреблений в произведениях А. Байтурсынулы. Создан электронный двуязычный словарь терминов А.Байтурсыулы из области методики обучения, лингвистики, литературоведения и смежных гуманитарных дисциплин. Цель словаря — систематизация терминологического аппарата А. Байтұрсынулы. Организован и проведен Международный круглый стол с приглашением известных лингвистов и тюркологов, занимающихся исследованием творчества А. Байтурсынова. Издана монрграфия "Языковое и культурное наследие А. Байтурсынулы: корпусный анализ параллельных текстов" (Рекомендовано УС КАзНПУ им. Абая, протокол №1 от 06.10.2025 г.).

Таңдалған шығармалардың қазақ-орыс әліпби индексі және А. Байтұрсынов шығармаларының негізгі мәтінінде кездесетін барлық сөздердің тізімі жасалды. А. Байтұрсынұлының қазақ-орыс параллель корпусы жасалды, мәтіндерге морфологиялық таңбалау жүргізілді. А. Байтұрсынұлының шығармаларында сөз қолдану картотекасы жасалды. Оқыту әдістемесі, лингвистика, әдебиеттану және сабақтас гуманитарлық пәндер саласынан А. Байтұрсынұлы терминдерінің электрондық екі тілді сөздігі жасалды. Сөздіктің мақсаты-А. Байтұрсынұлының терминологиялық аппаратын жүйелеу. А.Байтұрсыновтың шығармашылығын зерттеумен айналысатын белгілі лингвистер мен түркологтарды шақыра отырып, Халықаралық дөңгелек үстел ұйымдастырылды және өткізілді. "А. Байтұрсынұлының тілдік және мәдени мұрасы: параллель мәтіндерді корпустық талдау" монрграфиясы жарық көрді (ҚазҰПУ ҚБ ұсынған. Абай, 06.10.2025 ж. №1 хаттама).

Объём корпуса — 37609 словоупотреблений; Общее количество материала: 56 ( из них на казахском языке - 30, на русском языке - 26) Структура корпуса — параллельное сопоставление оригинала (казахский язык) и перевода (русский язык); Тип корпуса — лингвистически размеченный, с функциями конкорданса, частотного анализа, автоматической лемматизации; Создан электронный двуязычный словарь терминов А.Байтурсыулы. Включает 400 терминов с переводами на русский язык. Формат реализации — электронная интерактивная база данных с возможностью расширения и обновления; Уровень автоматизации обработки данных — полный (поиск, фильтрация, статистический анализ, экспорт данных); Перспективы масштабирования — возможное расширение корпуса за счёт включения других авторов и переводов, а также интеграция в образовательные и исследовательские цифровые платформы; Экономическая эффективность — снижение временных и трудовых затрат на лингвистический анализ текста по сравнению с традиционными методами (в среднем в 5–7 раз); Потенциал коммерциализации — создание цифрового исследовательского инструмента и образовательного ресурса, применимого в университетах, переводческих центрах и цифровых гуманитарных проектах.

Корпус көлемі - 37609 сөз қолдану; Материалдың жалпы саны: 56 ( оның ішінде қазақ тілінде - 30, орыс тілінде - 26) Корпустың құрылымы-түпнұсқаны (қазақ тілі) және аударманы (орыс тілі)қатар салыстыру; Корпус түрі-лингвистикалық тұрғыдан белгіленген, конкорданс, жиілікті талдау, Автоматты лемматизация функциялары бар; А. Байтұрсынұлы терминдерінің электрондық екі тілді сөздігі жасалды. Орыс тіліне аудармасы бар 400 терминді қамтиды. Іске асыру форматы-кеңейту және жаңарту мүмкіндігі бар электрондық интерактивті мәліметтер базасы; Деректерді өңдеуді автоматтандыру деңгейі-толық (іздеу, сүзу, статистикалық талдау, деректерді экспорттау) ; Масштабтау перспективалары-басқа авторлар мен аудармаларды қосу және білім беру және зерттеу цифрлық платформаларына интеграциялау арқылы корпустың ықтимал кеңеюі; Экономикалық тиімділік-дәстүрлі әдістермен салыстырғанда Мәтінді лингвистикалық талдауға кететін уақыт пен еңбек шығындарының төмендеуі (орта есеппен 5-7 есе); Коммерцияландыру әлеуеті-университеттерде, аударма орталықтарында және цифрлық гуманитарлық жобаларда қолданылатын цифрлық зерттеу құралы мен білім беру ресурсын құру.

Результаты исследования частично внедрены в учебный процесс при преподавании курсов по корпусной лингвистике и переводоведению в высших учебных заведениях. Созданный параллельный корпус используется в качестве научно-исследовательского инструмента для анализа авторского стиля Ахмета Байтурсынулы, а также как практическая база для подготовки студентов-филологов, магистрантов и докторантов, что нашло отражение в силлабусах по дисицплинам "Корпусная лингвистика". Корпус имеет потенциал дальнейшего внедрения в цифровые образовательные платформы, электронные словари, системы автоматического обучения переводу и национальные лингвистические ресурсы.

Зерттеу нәтижелері жоғары оқу орындарында Корпустық лингвистика және аударматану курстарын оқыту кезінде оқу процесіне ішінара енгізілді. Құрылған параллель корпус Ахмет Байтұрсынұлының авторлық стилін талдау үшін ғылыми-зерттеу құралы ретінде, сондай-ақ "Корпустық лингвистика"пәндері бойынша силлабустарда көрініс тапқан филология студенттерін, магистранттар мен докторанттарды даярлау үшін практикалық база ретінде пайдаланылады. Корпустың цифрлық білім беру платформаларына, электрондық сөздіктерге, аударманы Автоматты оқыту жүйелеріне және Ұлттық лингвистикалық ресурстарға одан әрі енгізу әлеуеті бар.

Использование методов корпусной лингвистики и цифровой обработки данных значительно повышает точность, объективность и скорость анализа текстов по сравнению с традиционными филологическими методами. Созданный параллельный корпус позволяет автоматизировать процессы отбора, классификации и статистической интерпретации языковых единиц, сокращая временные и трудовые затраты исследователя в 5–7 раз. Эффективность также проявляется в расширении научных возможностей: проект обеспечивает воспроизводимость результатов, возможность многопараметрического анализа, интеграцию в образовательную и переводческую практику. Корпус может служить основой для дальнейших научных разработок, межъязыковых сопоставлений и создания интеллектуальных языковых технологий.

Корпустық лингвистика мен цифрлық деректерді өңдеу әдістерін қолдану дәстүрлі филологиялық әдістермен салыстырғанда мәтіндерді талдаудың дәлдігін, объективтілігін және жылдамдығын айтарлықтай жақсартады. Құрылған параллель корпус зерттеушінің уақыты мен еңбек шығындарын 5-7 есе азайта отырып, тілдік бірліктерді іріктеу, жіктеу және статистикалық түсіндіру процестерін автоматтандыруға мүмкіндік береді. Тиімділік ғылыми мүмкіндіктерді кеңейтуде де көрінеді: жоба нәтижелердің қайталануын, көп параметрлік талдау мүмкіндігін, білім беру және аударма практикасына интеграцияны қамтамасыз етеді. Корпус одан әрі ғылыми әзірлемелерге, тіларалық салыстыруларға және интеллектуалды тілдік технологияларды құруға негіз бола алады.

Параллельный корпус текстов А. Байтурсынулы представляет собой цифровой контент, который будет эффективно использоваться в исследованиях в области лингвистики, в учебном процессе, в переводоведении и др. Сайт казахско-русского параллельного корпуса Ахмета Байтурсынулы может быть использован для проведения исследований в области лексикографии, лингводидактики, переводоведения, а также в учебном процессе и при расширении цифрового лингвистического контента. Кроме того, он может быть использован в программах повышения квалификации и переподготовки учителей и преподавателей вузов, а также при разработке национальных и параллельных корпусов.

Таңдалған шығармалардың қазақ-орыс әліпби индексі және А. Байтұрсынов шығармаларының негізгі мәтінінде кездесетін барлық сөздердің тізімі жасалды. А. Байтұрсынұлының қазақ-орыс параллель корпусы жасалды, мәтіндерді белгілеу. А. Байтұрсынұлының шығармаларында сөз қолдану картотекасы жасалды. А. Байтұрсынұлы терминдерінің электрондық екі тілді сөздігі жасалды. А.Байтұрсыновтың шығармашылығын зерттеумен айналысатын белгілі лингвистер мен түркологтарды шақыра отырып, Халықаралық дөңгелек үстел ұйымдастырылды және өткізілді. "А. Байтұрсынұлының тілдік және мәдени мұрасы: параллель мәтіндерді корпустық талдау" монрграфиясы жарық көрді (ҚазҰПУ ҚБ ұсынған. Абай, 06.10.2025 ж. №1 хаттама)

UDC indices
081
International classifier codes
16.31.02;
Readiness of the development for implementation
Key words in Russian
казахско-русский параллельный корпус; двуязычный электронный алфавитно-частотный конкорданс; двуязычный терминологический словарь А. Байтурсынова; теория и практика переводческой лексикографии; электронный словарь словоупотреблений А. Байтурсынова;
Key words in Kazakh
қазақ-орыс параллель корпусы; екітілді электронды алфавиттік-жиілік сәйкестігі; А.Байтұрсыновтың қос тілді терминологиялық сөздігі; аударма лексикографиясының теориясы мен тәжірибесі; А.Байтұрсыновтың сөз қолданысының электронды сөздігі;
Head of the organization Тілеп Болат Анапияұлы Кандидат политических наук /
Head of work Байшукурова Гулнур Жолаушыбаевна Кандидат филологических наук / нет
Native executive in charge