Inventory number IRN Number of state registration
0222РК00366 BR11765619-OT-22 0122РК00221
Document type Terms of distribution Availability of implementation
Промежуточный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 11
International publications: 1 Publications Web of science: 0 Publications Scopus: 0
Number of books Appendicies Sources
1 2 16
Total number of pages Patents Illustrations
64 0 7
Amount of funding Code of the program Table
150000000 О.1058 4
Code of the program's task under which the job is done
01
Name of work
РАЗРАБОТКА НАЦИОНАЛЬНОГО КОРПУСА КАЗАХСКОГО ЯЗЫКА КАК ИНФОРМАЦИОННО-ИННОВАЦИОННОЙ БАЗЫ ГОСУДАРСТВЕННОГО ЯЗЫКА: НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ И ОБУЧАЮЩИЙ ИНТЕРНЕТ-РЕСУРС
Report title
Type of work Source of funding The product offerred for implementation
Applied research Материалы
Report authors
Фазылжанова Анар Муратовна , Уәли Нұргелді , Базарбаева Зейнеп Муслимовна , Манкеева Жамал Айткалиевна , Малбаков Мырзаберген Малбакович , Шойбеков Рустембек Нусухабекович , Мамынова Бағдан Қатайқызы , Алдаш Айманкүл , Кудеринова Куралай Бимолдиновна , Рысберген Қыздархан Кұрмашқызы , Жанабекова Айман Абдильдаевна , Аманбаева Айсауле Жантемировна , Хабиева Алмагуль Алтаевна , Сейтбекова Айнур Аташбековна , Амирбекова Айгул Байдебековна , Амиржанова Назира Сериковна , Кулманов Сарсенбай Куантаевич , Жумабаева Жанара Толендиевна , Ашимбаева Нагима Масимакунова , Солтанбекова Альфия Абдыкеновна , Утебаева Эльмира Абдугалиевна , Маралбек Ермұхамет , Пашан Дана Мұсабекқызы , Шуленбаев Нурлан Кунпияевич , Бисенғали Ақмарал Зинол-Ғабденқызы , Шормакова Арайлым Ботановна , Дүйсен Қуатбек Қонысбайұлы , Рамазанов Талгат Бекбулатович , Кожахметова Актоты Кожахметкызы , Тлегенова Гульден Бакытказыевна , Барменкулова Аида Серикхановна , Сейдамат Әсел Қазбекқызы , Нұрлан Меруерт Ерқанатқызы , Сейтбатқал Арлен Берікұлы , Аязбаев Галымжан Маратович , Мурсал Айкерим - ,
1
0
6
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Республиканское государственное предприятие на праве хозяйственного пользования "Институт языкознания имени А.Байтурсынова"
Abbreviated name of the service recipient РГП на ПХВ "ИЯ им. А.Байтурсынова" КН МОН РК
Abstract

исследование проблем научной дисциплины отечественной корпусной лингвистики системой новых знаний, накопленных в ходе разработки НККЯ как научно-исследовательского Интернет-ресурса.

қазіргі қазақ тіл білімінің өзекті проблемасы отандық Корпустық лингвистика ғылыми пәнінің мазмұнын ҚТҰК әзірлеу барысында жинақталған теориялық және практикалық жаңа білімдер жүйесімен байыту

разработка и обеспечение деятельности глубоко аннотированной, сбалансированной, репрезентативной НККЯ с объемом оцифрованной текстовой базы в 40 млн словоупотреблений, как научно-исследовательского и обучающего Интернет-ресурса, предоставляющего исчерпывающую информацию об истории, динамике развития, современном состоянии казахского языка и удовлетворяющий различные лингвистические потребности общества.

қазақ тілінің тарихы, даму динамикасы, бүгінгі жағдайы туралы жан-жақты ақпарат беретін әрі қоғамның алуан түрлі тілтанымдық мұқтажын өтейтін, ғылыми-зерттеу және оқыту Интернет-ресурсы ретіндегі цифрланған мәтіндік базасының көлемі 40 млн сөзқолданыстан тұратын, терең аннотацияланған, теңгерімді, репрезентативті ҚТҰК әзірлеу және қызметін қамтамасыз ету.

в создании текстовой базы подкорпусов, включаемых в состав НККЯ, применяются технические методы сбора, цифровизации текстового материала; в разработке лексико-семантических разметок – метод классификации и группировки лексических единиц; в разработке культурно-семантических разметок – метод сбора, дефинирование и мотивационный анализ семантики этномаркированных лексико-фразеологических, паремиологических единиц; при разработке казахско-русского параллельного подкорпуса – метод идентификации (выравнивания) текстов двух языков; при разработке подкорпуса исторических текстов казахского языка – историко-сравнительный метод. При разработке подкорпуса устной речи используются технические методы записи и сбора устных текстов, приведение аудиотекстов в письменную электронную форму; при разработке просодических разметок – анализ и синтез элементов звучащей речи, экспериментально-фонетические методы; компьютерно-программные методы используются при разработке лингвистических разметок подкорпусов НККЯ и совершенствовании интерфейса поисковой системы, позволяющей пользователю быстро находить необходимую лингвистическую и экстралингвистическую информацию

ҚТҰК құрамына енгізілетін ішкорпустардың мәтіндер базасын жасауда жинақтау әдісі; лексика-семантикалық белгіленім әзірлемесін жасауда қазақ сөздерін топтау, мәдени-семантикалық белгіленім әзірлемесін жасауда мәдени мазмұны бар сөздерді жинақтау, дефиниция беру (түсініктеме), мәдени бірліктердің шығуына негіз болған уәждемелік талдау әдісі; Қазақ-орыс параллель ішкорпусын әзірлеуде екі тілдегі мәтін аудармасын сәйкестендіру (выравнивание) әдісі; Тарихи ішкорпус мәтіндері бойынша белгіленімдер енгізуде тарихи-салыстырмалы әдіс қолданылады. Ауызша ішкорпусты құрастыруда ауызша мәтіндерді таспаға жазу, аудиомәтіндерді жазбаша электронды пішінге келтіру; просодикалық белгіленім әзірлемін жасауда анализ және синтездеу, эксперименттік әдістер; ҚТҰК ішкорпустары бойынша аталған лингвистикалық белгіленімдер әзірлемесін жасауда және пайдаланушыға қажетті лингвистикалық және экстралингвистикалық ақпаратты жылдам тауып алуға мүмкіндік беретін «Іздеу» жүйесі интерфейсін жетілдіруде компьютерлік-бағдарламалық әдістер

- 2 статьи в зарубежном научном журнале с ненулевым импакт-фактором, - 9 статей в КОКСНВО МНВО РК; - 2 статьи в в республиканских научных изданиях; - 4 научные и научно-популярные статьи, интервью в СМИ, на ТВ; - проведены 2 круглых стола; - организовано 2 лингвистических семинаров; - Опубликована 1 монография; - база аутентичных переводных текстов на казахском и на русском языках - база публичной речи, научного и делового дискурса, записанные аудиоустройством; - база письменных памятников.

- нөлдік емес импакт-факторы бар шетелдік ғылыми журналда 2 мақала; - ҚР БҒМ БҒСҚК ұсынған ғылыми журналдарда 9 мақала; - республикалық ғылыми басылымдарда 2 мақала; - БАҚ-та, ТВ-да 4 ғылыми және ғылыми-көпшілік мақалалар, сұхбаттар; - 2 дөңгелек үстел өткізілді; - 2 лингвистикалық семинар ұйымдастырылды; - қазақ және орыс тілдеріндегі теңестірілген мәтіндік база; - аудиотаспаға жазылған ауызекі, шаршысөз, ғылыми және іскери дискурс мәтіндері базасы; - тарихи жазба мұрағаттар базасы;

не предусмотрено

қарастырылмаған

нет

жоқ

разрабатываемые виды подкорпусов и лингвистические разметки, получаемые в результате программы, способствуют использованию государственного языка в различных сферах коммуникации, в том числе экономии энергии (мощностей) и времени (временных возможностей), затрачиваемых в научно-исследовательском и обучающем, образовательном процессах; - результаты исследования способствуют развитию научно-теоретической, фактологической, эмпирической, инвентарной базы казахского языка; - "Казахско-русский параллельный подкорпус" способствует изучению двуязычия, переводу, автоматическому машинному переводу, овладению изучающими язык соответствием двухъязычных синтаксических конструкций, фразеологизмов; - »Устный подкорпус" на основе устных записанных текстов способствует освоению орфоэпической системы речи, изучению языка, распознаванию различий между письменным и устным языком; помогает в составлении орфографических и орфоэпических словарей, в составлении правил правописания, в определительном письме и т.д. в составлении различных практических пособий по языкознанию может быть инструментом; позволит исследователям определить коммуникативные прагматические коннотации произношения в коммуникации, а также станет массивом внедрения просодических обозначений в НККЯ

бағдарлама нәтижесінде алынатын ҚТҰК-ның ішкорпус және жаңадан әзірленетін лингвистикалық белгіленім түрлері мемлекеттік тілді коммуникацияның әралуан саласында қолдануға, оның ішінде ғылыми-зерттеу мен оқыту, білім беру процесінде жұмсалатын қуатты (қуатсыйымдылығы) және уақытты (уақытсыйымдылығы) үнемдеуге септігін тигізеді; - зерттеу нәтижелері қазақ тілінің ғылыми-теориялық, фактологиялық, эмпирикалық, инвентарлық базасын дамытуға ықпал етеді; - «Қазақша-орысша параллель ішкорпусы» екі тілді салғастыра зерттеуге, аударма жасауға, автоматты машиналық аудармаға, тіл үйренушілердің екі тілдегі синтаксистік конструкциялар, фразеологиялық тұтастықтар баламалары сәйкестігін меңгеруге жәрдемдеседі; - «Қазақ тілінің ауызша тіл ішкорпусы» ауызша таспаға жазылған мәтіндер негізінде ҚТҰК қолданылушыларына, тіл үйренушілерге сөйлеудің орфоэпиялық жүйесін меңгеруге, жазба тіл мен ауызша тілдің айырмашылықтарын тани білуге септігін тигізеді; орфографиялық және орфоэпиялық сөздіктер құрастыруда, емле ережелерін жасауда, анықтағыш жазуда және т.б. тіл білімі салалары бойынша әртүрлі практикалық құралдар құрастыруда көмекші құрал бола алады; зерттеушілерге коммуникациядағы айтылымның коммуникативтік прагматикалық діттемдерін айқындауға мүмкіндік береді, сонымен қатар «Қазақ тілінің ауызша тіл ішкорпусы» ҚТҰК-ға просодикалық белгіленімдер енгізудің массиві болады

1) повысить эффективность процесса обучения государственному языку, тем самым способствуя консолидации казахстанского общества, сохранению его духовной безопасности и формированию общегосударственной, национальной идентичности; 2) способствовать многократному увеличению количества лингвистических исследований, значительному упрощению процесса обработки обширного языкового эмпирического материала, проведению процесса цифровизации текстов на казахском языке и повышению степени достоверности и объективности научных исследований по казахской лингвистике, сравнительно-сопоставительной лингвистике, укреплению научно-теоретической базы государственного языка; 3) создать предпосылки к исследованиям в области отечественной истории, литературы, культуры и других наук, тесно связанных с языком, раскрыть множество новых, ранее неизученных знаний о казахской этноязыковой общности и ее представителях и др.;

1) мемлекеттік тілді оқыту үдерісінің тиімділігін арттыруға, сол арқылы қазақстандық қоғамды ұйыстыруға, оның рухани қауіпсіздігін сақтау және ұлттық бірегейлікті қалыптастыруға қызмет етеді; 2) лингвистикалық зерттеулер санын бірнеше есе ұлғайтуға, тілдік материалды өңдеу үдерісін айтарлықтай оңайлатуға, цифрландыру үдерісін қазақ тілінде жүргізуге және қазақ тіл білімі, салыстырмалы-салғастырмалы лингвистика бойынша ғылыми зерттеулердің дәйектілігі мен объективтілік дәрежесін көтеруге, мемлекеттік тілдің ғылыми-теориялық базасын нығайтуға септігін тигізеді; 3) отандық тарих, әдебиет, мәдениет және басқа да ғылым салаларындағы тілмен тығыз байланысты зерттеулерге алғышарт жасау, қазақ этнотілдік қоғамдастығы мен оның өкілдері және т.б. туралы көптеген жаңа, бұрын зерттелмеген білімдер ашуға мүмкіндік береді;

UDC indices
81`33
International classifier codes
16.31.00;
Readiness of the development for implementation
Key words in Russian
Национальный корпус казахского языка; параллельный корпус; корпусная лингвистика; гуманитарная информатика; обучающий интернет-ресурс;
Key words in Kazakh
Қазақ тілінің ұлттық корпусы; параллель корпус; корпустық лингвистика; гуманитарлық информатика; оқыту интернет-ресурсы;
Head of the organization Фазылжанова Анар Муратовна Доктор филологических наук / профессор, член-корреспондент НАН РК
Head of work Фазылжанова Анар Муратовна Кандидат филологических наук / нет
Native executive in charge