Inventory number IRN Number of state registration
0323РК01896 AP15473441-KC-23 0122РК00932
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 3
International publications: 3 Publications Web of science: 0 Publications Scopus: 0
Patents Amount of funding Code of the program
0 6948195 AP15473441
Name of work
"РАЗРАБОТКА СЛОВООБРАЗОВАТЕЛЬНЫХ РАЗМЕТОК В КОРПУСЕ ТЕКСТОВ КАЗАХСКОГО ЯЗЫКА"
Type of work Source of funding Report authors
Applied Пірманова Күнсұлу Қамбарбекқызы
0
0
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Некоммерческое акционерное общество "Казахский национальный университет имени аль-Фараби"
Abbreviated name of the service recipient НАО "КазНУ им. аль-Фараби"
Abstract

корпусная лингвистика, словообразовательные разметки

корпустық лингвистика, сөзжасамдық белгіленімдер

Создание языковой базы для включения в корпус словообразовательных разметок на казахском языке и подготовки разработки программы

Қазақ тіліндегі сөзжасамдық белгіленімдерді корпусқа енгізудің тілдік базасын жасау және программалық әзірлемесін дайындау

а) компьютерный метод: автоматический поиск информации (information retrieval, IR), индексирование словарного запаса, лемматизация, токенизация, количественный метод, методы статистического анализа, поиск слов в текстах (конкорданс); б) филологическая экспертиза: лингвистическая обработка текста, создание базы данных текстов, автоматические словообразовательные анализы, создание словаря (регистра) (список парных слов, словарь слитных слов, список словообразовательных аффиксов), словарь компиляция; б) методы программирования: создание языка программирования и системы команд, программирование по выбранному стандарту, визуальное программирование, структурное программирование, структурирование новых типов данных, динамическое управление памятью; в) метод описания: языковые особенности в корпусе и вопросы словообразования, обзор словообразовательных особенностей в национальном корпусе турецкого и русского языков, определение словообразовательных и формообразующих функций двойственных функциональных дополнений и т.д.

а) компьютерлік әдіс: ақпаратты автоматты түрде алу (information retrieval, IR), сөздік материалды индекстеу, лемматизация, токенизация, квантитативтік әдіс, статистикалық талдау тәсілдері, мәтіндер (конкорданстар) ішінен сөз іздеу; ә) филологиялық сараптамалық талдау: мәтінді лингвистикалық өңдеу, мәтіндер базасын жасау, автоматты сөзжасамдық талдаулар, сөзтізбе (реестр) жасау (қос сөздер тізімі, біріккен сөздер сөздігі, сөзжасамдық қосымшалар тізімі), сөздік құрастыру; б) бағдарламалау әдістері: бағдарламалау тілін және пәрмендер жүйесін жасау, таңдалған стандартпен бағдарламалау, визуальды бағдарламалау, құрылымдық бағдарламалау, деректердің жаңа типтерін құрылымдау, жадты динамикалық басқару; в) сипаттама әдісі: корпустағы лингвистикалық белгіленімдер және сөзжасам мәселелері, түрік және орыс тілінің ұлттық корпусындағы сөзжасамдық белгіленімдер туралы шолу, қос функциялы қосымшалардың сөзжасамдық және формажасамдық қызметін айқындау және т.б.

Научную новизну в исследовательской программе можно охарактеризовать по трем основным аспектам: 1) научно-теоретическая новизна: - изучается научно-теоретический опыт создания базы текстов для автоматического словообразовательного анализа казахских текстов; 2) научно-практическая новизна: - определяются словообразовательные и формообразовательные функции функциональных аффиксов на казахском языке; - словарь слитных слов на казахском языке и составляется список парных слов, список словообразовательных аффиксов; - разрабатывается и внедряется в программу автоматическое распознавание словообразовательных разметок на казахском языке в корпусе. 3) научно-методическая новизна: база текстов для автоматического словообразовательного анализа казахских текстов для обучающихся, языковедов, самостоятельных соискателей, компьютерные ориентиры и инициативы, такие как словарь и список с описанием словообразовательных аффиксов, списков парных слов, слитных слов и автоматическое распознавание слов в тексте и др.

Зерттеу бағдарламасындағы ғылыми жаңашылдықты негізгі үш қыры бойынша сипаттауға болады: 1) ғылыми-теориялық жаңалығы: - қазақ мәтіндеріне автоматты сөзжасамдық талдау жасау үшін мәтіндер базасын жасаудың ғылыми-теориялық тәжірибесі зерттеледі; 2) ғылыми-практикалық жаңалығы: - қазақ тіліндегі функционалды қосымшалардың сөзжасамдық және формажасамдық қызметтері айқындалады; - қазақ тіліндегі біріккен сөздер сөздігі жасалады және қос сөздер тізімі, сөзжасамдық қосымшалар тізімі кестеге түсіріледі; - қазақ тіліндегі сөзжасамдық белгіленімдерді корпуста автоматты тану әзірлемесі жасалып, программаға енгізіледі. 3) ғылыми-әдістемелік жаңалығы: білім алушыларға, тіл мамандарына, өздігінен ізденушілерге арналған қазақ мәтіндеріне автоматты сөзжасамдық талдау жасауға арналған мәтіндер базасы, сөз тудырушы қосымшаларға, қос сөздер тізіміне, біріккен сөздерге сипаттама беретін сөздік пен тізім және мәтіндегі сөздерді автоматты түрде тану сияқты компьютерлік бағдармалар мен бастамдар т.б.

Основные конструктивные показатели в данной теме могут включать в себя: Объем текстов: определение количества слов и текста, охватываемых исследованием, чтобы получить представление о масштабе. Разнообразие аффиксов: анализ различных словообразовательных аффиксов в казахском языке, включая их типы и способы использования. Структурная организация аффиксов: исследование того, как аффиксы сочетаются друг с другом и с основными словами, чтобы выявить характерные и структурные особенности. Эволюция словообразовательных процессов: исследование изменений в использовании аффиксов на протяжении всего времени, если доступны данные из разных периодов. Лексическая продуктивность: определение, эффективное и продуктивное использование аффиксов для создания новых слов в языке. Технико-экономические показатели: Затраты на исследование: Оценка финансовых ресурсов, необходимых для проведения исследования, включая затраты на лингвистическую экспертизу и анализ данных. Временные рамки: определение времени, требуемого для сбора и обработки данных, а также составление итогового отчета. Ожидаемые результаты: Разработка словообразовательных разметок в корпусе текстов казахского языка могут включать в себя новые научные открытия, развитие понимания структуры языка, лингвистического корпуса и т.д. Социальная значимость: использования исследований для общества и науки, например, в поддержку сохранения и развития культурного наследия.

Осы тақырыптағы негізгі конструктивті көрсеткіштер мыналарды қамтуы мүмкін: Мәтін көлемі: масштаб туралы түсінік алу үшін зерттеуде қамтылған сөздер мен мәтіндердің санын анықтау. Әр түрлі аффикстер: қазақ тіліндегі әр түрлі сөзжасамдық аффикстерді, олардың түрлері мен қолдану тәсілдерін талдау. Аффикстердің құрылымдық ұйымы: сипаттамалық және құрылымдық ерекшеліктерді анықтау үшін аффикстердің бір-бірімен және негізгі сөздермен қалай үйлесетінін зерттеу. Сөзжасам процестерінің эволюциясы: әр түрлі кезеңдерден алынған мәліметтер қол жетімді болған кезде аффикстерді қолданудағы өзгерістерді зерттеу. Лексикалық өнімділік: тілде жаңа сөздер жасау үшін аффикстерді анықтау, тиімді және өнімді қолдану. Техникалық-экономикалық көрсеткіштер: Зерттеу шығындары: лингвистикалық сараптама мен деректерді талдау шығындарын қоса алғанда, зерттеу жүргізу үшін қажетті қаржылық ресурстарды бағалау. Уақыт шеңбері: деректерді жинау және өңдеу үшін қажетті уақытты анықтау және қорытынды есеп жасау. Күтілетін нәтижелер: қазақ тілі мәтіндерінің корпусында сөзжасамдық белгілерді әзірлеу жаңа ғылыми жаңалықтарды, тіл құрылымын, лингвистикалық корпусты және т. б. түсінуді дамытуды қамтуы мүмкін. Әлеуметтік маңыздылығы: зерттеулерді қоғам мен ғылым үшін пайдалану, мысалы, мәдени мұраны сақтау мен дамытуды қолдау.

нет

жоқ

- осуществление деятельности компьютерной программы словообразовательных разметок в общедоступной онлайн-системе; - включение в интернет базы данных различных словарей (список парных слов, словарь слитных слов, список словообразовательных аффиксов) для большинства пользователей; - доступность языковых познавательных материалов для обучающихся (учащихся, студентов, магистрантов, докторантов), обучающихся (учителей школ, методистов, авторов учебников, преподавателей вузов), специалистов-корреспондентов и ученых и др.

- жалпы көпшілікке арналған онлайн жүйесіндегі сөзжасамдық белгіленімдер компьютерлік бағдарламасы қызметінің жүзеге асырылуы; - көпшілік пайдаланушыларға арналған әртүрлі сөздік (қос сөздер тізімі, біріккен сөздер сөздігі, сөзжасамдық қосымшалар тізімі) базасының интернет жүйесіне енгізілуі; - білім алушылар (оқушылар, студенттер, магистранттар, докторанттар), білім берушілер (мектеп мұғалімдері, әдіскерлер, оқулық авторлары, жоғары оқу орын оқытушылары), тілші мамандар мен ғалымдар т.б. арналған тілдік танымдық материалдар қолжетімділігі т.б.

- осуществление автоматического словообразовательного анализа текста способствует, прежде всего, решению многих языковых явлений в области лингвистики, легкому проведению языковых исследований, познанию языка под новым углом зрения, созданию эффективных лингвистических практических инструментов; - реализация программы автоматического словообразовательного анализа текста способствует выпуску различных методических пособий, учебников, учебных пособий в учебно-методической сфере, созданию лексических минимумов и созданию с этой целью частотных словарей, повышению эффективности языкового анализа; - реализация программы автоматической обработки текста позволяет развивать дело компьютерного программирования, так как тесно связана с областью информатики. - реализация программы автоматической обработки текста имеет свою деятельность и в общественной социальной сфере, так как открывает путь к возрождению всех видов общественной деятельности, осуществляемой через казахский язык.

- мәтінге автоматты сөзжасамдық талдауды жүзеге асыру ең алдымен лингвистика саласында көптеген тілдік құбылыстарды шешуге, тілдік зерттеулерді оңай жүргізуге, тілді жаңа қырынан тануға, тиімді лингвистикалық практикалық құралдар шығаруға ықпал етеді; - мәтінге автоматты сөзжасамдық талдау бағдарламасының жүзеге асыру оқу-әдістеме саласында әртүрлі әдістемелік құралдар, оқулықтар, оқу құралдарын шығаруға, лексикалық минимумдар жасау және осы мақсатта жиілік сөздіктер құрастыру, тілдік талдаулар тиімділігін арттыру сияқты мәселелердің шешімін табуға ықпалы мол; - мәтінді автоматты өңдеу бағдарламасын жүзеге асыру информатика саласымен тығыз байланысты болғандықтан, компьютерлік бағдарламалау ісінің дамуына мүмкіндік береді. - мәтінді автоматты өңдеу бағдарламасын жүзеге асыру қоғамдық әлеуметтік салада да өзіндік қызметке ие, өйткені ол қазақ тілі арқылы жүзеге асатын барлық қоғамдық қызмет түрлерінің жандануына жол ашады.

UDC indices
81’33
International classifier codes
16.00.00;
Key words in Russian
прикладная лингвистика; корпусная лингвистика; национальный корпус; разметка; словообразовательные разметки;
Key words in Kazakh
қолданбалы лингвистика; корпустық лингвистика; ұлттық корпус; белгіленім; сөзжасамдық белгіленімдер;
Head of the organization Жамилa Нурматовна Айтжанова Пірманова Күнсұлу Қамбарбекқызы / магистр
Head of work Пірманова Күнсұлу Қамбарбекқызы / жоқ