Inventory number IRN Number of state registration
0223РК00396 AP09057872-OT-23 0121РК00358
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 1
International publications: 3 Publications Web of science: 1 Publications Scopus: 3
Number of books Appendicies Sources
1 3 36
Total number of pages Patents Illustrations
121 0 38
Amount of funding Code of the program Table
17986248.2 AP09057872 4
Name of work
Модели и методы инклюзивной интеллектуальной системы поддержки людей с ограниченными возможностями
Report title
Type of work Source of funding The product offerred for implementation
Applied Метод, способ
Report authors
Еримбетова Айгерим Сембековна , Дайырбаева Эльмира Нурбеккызы , Ибраимкулов Айбек Еркаманұлы , Сәкенов Бақжан Ерланұлы ,
0
1
2
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Abbreviated name of the service recipient ИИВТ
Abstract

Объектом исследования является система автоматического преобразования входной текстовой информации в Казахско-Русский жестовый язык (КРЖЯ)

Зерттеу нысаны – кіріс мәтіндік ақпаратты қазақ-орыс ымдау тіліне (ҚОЫТ) автоматты түрлендіру жүйесі

Целью проекта является создание научно-технического задела в области информационно-коммуникационных технологий и на применение новых знаний, позволяющих совершенствовать восприятие, понимание и репродуцирование текстового материала на казахском языке слабослышащими путем разработки компьютерного анимационного жестового словаря ключевых слов по ИТ с использованием алгоритмов нормализации слов казахского языка и системы компьютерного сурдоперевода на Казахско-Русский жестовый язык (КРЖЯ) с учетом морфологии казахского языка.

Жобаның мақсаты ақпараттық-коммуникациялық технологиялар саласында ғылыми-техникалық негіз құру және қазақ тілінің морфологиясын ескере отырып, қазақ тілінің сөздерін қалыпқа келтіру алгоритмдерін және қазақ-орыс ымдау тіліне (ҚОЫТ) компьютерлік сурдоаударма жүйесін пайдалана отырып, АТ бойынша түйінді сөздердің компьютерлік анимациялық ымдау сөздігін әзірлеу жолымен қазақ тіліндегі мәтіндік материалды нашар еститіндердің қабылдауын, түсінуін және репродукциялауын жетілдіруге мүмкіндік беретін жаңа білімді қолдану болып табылады.

В исследовании будут использованы методы из следующих областей знаний: лингвистика казахского языка, компьютерная лингвистика, лингвистика жестового языка, компьютерное моделирование. Лингвистические методы. Методы структурной лингвистики рассматривают слово как основную единицу языка и позволяют членить тексты на минимальные для морфологического уровня сегменты (морфы) и будут использованы для установления их дистрибьюции и подведения их под определенные единицы структуры языка (морфемы). Методы компьютерного моделирования. КЖЯ предназначен для воспроизведения отдельных букв (дактилем) алфавита естественного языка, которые показываются пальцами одной руки. Использование компьютерного моделирования для отображения отдельных дактилем и слов предполагает создание трехмерной модели кисти руки человека. Методы мультимедийной визуализации. Достижения современных информационных технологий (ИТ) в области компьютерной графики, анимации, воссоздание и воспроизведение различных по уровню сложности процессов дают возможность на новом уровне реализовать визуализацию изучаемых объектов, процессов, явлений, а также их моделей. Использование мультимедийной системы визуализации жестов для восприятия людьми с нарушениями слуха с использованием аватара позволит повысить скорость восприятия с точки зрения распознавания и воспроизведения, запоминаемость, снизить утомляемость и др.

Зерттеуде келесі білім салаларының әдістері қолданылады: қазақ тілі лингвистикасы, компьютерлік лингвистика, ымдау тілі лингвистикасы, компьютерлік модельдеу. Лингвистикалық әдістер. Құрылымдық лингвистика әдістері бұл сөзді тілдің негізгі бірлігі ретінде қарастырады және мәтіндерді морфологиялық деңгей үшін минималды сегменттерге (морфаларға) бөлуге мүмкіндік береді және оларды бөлу және оларды тіл құрылымының белгілі бір бірліктеріне (морфемаларға) жеткізу үшін қолданылады. Компьютерлік модельдеу әдістері. ҚЫТ бір қолдың саусақтарымен көрсетілетін табиғи тіл алфавитінің жеке әріптерін (дактилдерін) шығаруға арналған. Жеке дактилдер мен сөздерді көрсету үшін компьютерлік модельдеуді қолдану адам қолының үш өлшемді моделін құруды қамтиды. Мультимедиялық визуализация әдістері. Компьютерлік графика, анимация, күрделілік деңгейі бойынша әртүрлі процестерді қайта құру және жаңғырту саласындағы заманауи ақпараттық технологиялардың (АТ) жетістіктері зерттелетін объектілердің, процестердің, құбылыстардың, сондай-ақ олардың модельдерінің визуализациясын жаңа деңгейде жүзеге асыруға мүмкіндік береді. Аватарды қолдана отырып, есту қабілеті бұзылған адамдардың қабылдауы үшін қимылдарды визуализациялаудың мультимедиялық жүйесін қолдану тану және көбейту, есте сақтау, шаршауды азайту және т. б. тұрғысынан қабылдау жылдамдығын арттырады.

Создания системы компьютерного сурдоперевода текста с казахского языка на Казахско-Русский жестовый язык с использованием мультимедийных возможностей современной компьютерной техники есть задача перевода текста в некоторую знаковую лингвистическую систему. В результате исследования были выявлены недостатки существующих аналогов, которые при разработке были учтены, разработано блок лексико-морфологического анализа (ЛМА), с целью выделения из текстового документа слова и предложений, состоящего из: ˗ Лексического анализатора для формирования лексических признаков слов казахского языка и входного текстового потока на абзацы, предложения и слова; ˗ Морфологического анализатора для выделения нормальной формы слов казахского языка (с использованием меры TF-IDF); ˗ Тезауруса ИТ терминов на казахском языке со словарными статьями, используемого в дальнейшем для распознания в тексте ключевых терминов (формирует семантические признаки), в том числе узкоспециализированных ИТ-термины на казахском языке. ˗ Синтаксического анализатора для анализа синтаксической конструкции предложений казахского языка с выделением связей между словами. Получение списка обобщенных грамматических конструкций для перевода на КЖЯ. ˗ Решение проблем лексикографического описания КЖЯ, обусловленных вариативностью жестов (например, разные по исполнению жесты, имеющие одно значение и проч.), проблем с синонимами и омонимами.

Қазіргі компьютерлік технологияның мультимедиялық мүмкіндіктерін пайдалана отырып, қазақ тілінен қазақ-орыс ымдау тіліне мәтінді компьютерлік сурдо-аударма жүйесін құру мәтінді қандай да бір ымдау-лингвистикалық жүйеге аудару міндеті болып табылады. Зерттеу нәтижесінде қолданыстағы аналогтардың кемшіліктері анықталды, олар әзірлеу кезінде ескерілді, тапсырма бойынша жоба командасы мәтіндік құжаттан сөздер мен сөйлемдерді бөліп көрсету мақсатында күнтізбелік жоспар бойынша лексикалық-морфологиялық талдау блогын (ЛМТ) жасады: ˗ Қазақ тілі сөздерінің лексикалық белгілерін және абзацтарға, сөйлемдер мен сөздерге кіріс мәтіндік ағынын қалыптастыруға арналған лексикалық талдағыш; ˗ Қазақ тілі сөздерінің қалыпты пішінін бөліп көрсетуге арналған морфологиялық талдағыш (TF-IDF шарасын пайдалана отырып); ˗ АТ терминдерінің қазақ тіліндегі тезаурусы, одан әрі негізгі терминдер мәтінінде тану үшін пайдаланылатын сөздік мақалалары (семантикалық белгілерді қалыптастырады), оның ішінде қазақ тіліндегі жоғары мамандандырылған АТ-терминдер. ˗ Сөздердің арасындағы байланысты бөліп көрсете отырып, қазақ тілі сөйлемдерінің синтаксистік құрылымын талдауға арналған синтаксистік талдағыш. ҚЫТ-ға аудару үшін жалпыланған грамматикалық құрылымдардың тізімін алу. ˗ Қимылдың өзгергіштігіне байланысты (мысалы, әр түрлі қимылдар, бір мағынасы бар және т.б.) ҚЫТ-ны лексикографиялық сипаттау мәселелерін шешу.), синонимдер мен омонимдермен байланысты мәселелер.

Экономический эффект от реализации проекта можно подсчитать только условно, если знать число сурдопереводчиков, работающих в узкоспециализированной отрасли. Например, электронные ЦОНы в Казахстане предоставляют услугу сурдоперевода путем удаленного доступа к личному каналу сурдопереводчика, что позволяет рассчитать затраты на их содержание и сравнить с затратами на разработки программы-сурдопереводчика. Разработанный программный комплекс может быть использован для дистанционного обучения лиц с ограниченными возможностями по ИТ-специальностям или для чтения дисциплины ИКТ обучающимся всех специальностей. Качественно составленный тезаурус является источником семантической информации, применяемый в различных технических приложениях, в особенности, в ИТ-отрасли. Пользователь может по жестовому тезаурусу найти интересующие его понятия или интересующие его термины в данной предметной области, в том числе являющиеся синонимами. Использование новейших отечественных разработок в области компьютерной лингвистики, интеллектуальных и мультимедийных технологий позволит создать мощное обучающее средство для развития письменной речи, а также повышения уровня владения русским языком для глухих и слышащих, что так необходимо в условиях информационной революции.

Жобаны іске асырудың әлеуметтік тиімділігі мүмкіндігі шектеулі адамдарды еститін адамдармен қоғамда өмірге бейімдеу, АТ-ның жоғары мамандандырылған саласында ақпаратқа қол жеткізу, олардың сөйлеу дағдылары мен сөздік қорын дамыту болып табылады. Бұл жобаның ауқымы кең, оны жеке мақсаттар үшін, кәсіби АТ саласында қолдануға болады. Егер сіз жоғары мамандандырылған салада жұмыс істейтін сурдоаудармашылардың санын білсеңіз, жобаны іске асырудың экономикалық тиімділігін шартты түрде есептеуге болады. Мысалы, Қазақстандағы электрондық ХҚКО сурдоаударма қызметін сурдоаудармашының жеке арнасына қашықтан қол жеткізу арқылы ұсынады. Әзірленген бағдарламалық кешен ат мамандықтары бойынша мүмкіндігі шектеулі адамдарды қашықтықтан оқыту үшін немесе барлық мамандықтағы білім алушыларға АКТ пәнін оқу үшін пайдаланылуы мүмкін. Сапалы құрастырылған тезаурус әртүрлі техникалық қосымшаларда, әсіресе АТ саласында қолданылатын семантикалық ақпарат көзі болып табылады. Пайдаланушы ым-ишара тезаурусы бойынша оны қызықтыратын ұғымдарды немесе оны қызықтыратын терминдерді осы пәндік салада, соның ішінде синонимдер ретінде таба алады. Компьютерлік лингвистика, зияткерлік және мультимедиялық технологиялар саласындағы соңғы отандық әзірлемелерді қолдану ақпараттық революция жағдайында қажет саңырау және есту үшін орыс тілін білу деңгейін жоғарылату үшін жазбаша сөйлеуді дамыту үшін қуатты оқыту құралын құруға мүмкіндік береді.

Публикации в рецензируемых научных изданиях, апробация результатов исследования на международных конференциях

Рецензияланатын ғылыми басылымдар, зерттеу нәтижелерін халықаралық конференцияларда апробациядан өтті

календарный план работ на 2021-2023 гг. полностью выполнен.

2021-2023 жж. негізделген күнтізбелік жоспар толық орындалды

Область применения результатов: компьютерная лингвистика, КРЖЯ, компьютерный сурдоперевод. Основные результаты проекта по применению новых методов и подходов исследования по направлению может значительно повлиять на развитие области компьютерной лингвистики, КЖЯ, улучшить исследование на тюркских языках, развитие машинного обучения и искусственного интеллекта, математических вычислений и т.д. Область применения данного проекта широка, он может использоваться для личных целей, в профессиональной ИТ-отрасли.

Нәтижелерді қолдану саласы: Компьютерлік лингвистика, ҚОЫТ, компьютерлік сурдоаударма. Зерттеу нәтижелері әртүрлі техникалық қосымшаларда, әсіресе АТ саласында қолданылатын болады, түрік және қазақ тілдеріне арналған көптілді агглютинативті жүйелерде, машиналық аударма үшін, робототехникалық және автоматтандырылған жүйелерде қолданылады. Бұл жобаның ауқымы кең, оны жеке мақсатта, кәсіби IT индустриясында пайдалануға болады.

UDC indices
004.912
International classifier codes
20.00.00; 43.00.00; 28.23.25; 28.23.39; 28.23.29;
Readiness of the development for implementation
Key words in Russian
казахская жестовая речь; казахский жестовый язык; синтаксический анализ; семантический анализ; дактилемы; компьютерный сурдоперевод; лица с ограниченными возможностями;
Key words in Kazakh
қазақ ымдау тілі; қазақ ым тілі; синтаксистік талдау; семантикалық талдау; дактилемалар; компьютерлік сурдоаударма; мүмкіндігі шектеулі адамдар;
Head of the organization Мутанов Галимкаир Мутанович Доктор технических наук / профессор
Head of work Еримбетова Айгерим Сембековна Доктор философии (PhD) / ассоциированный профессор
Native executive in charge