| Inventory number | IRN | Number of state registration |
|---|---|---|
| 0225РК01201 | BR24992875-OT-25 | 0124РК01194 |
| Document type | Terms of distribution | Availability of implementation |
| Промежуточный | Gratis | Number of implementation: 0 Not implemented |
| Publications | ||
| Native publications: 4 | ||
| International publications: 4 | Publications Web of science: 2 | Publications Scopus: 2 |
| Number of books | Appendicies | Sources |
| 1 | 4 | 49 |
| Total number of pages | Patents | Illustrations |
| 147 | 0 | 30 |
| Amount of funding | Code of the program | Table |
| 174993869.4 | О.1372 | 5 |
| Code of the program's task under which the job is done | ||
| 01 | ||
| Name of work | ||
| Разработка комплекса сурдо-ресурсов с использованием искусственного интеллекта для людей с нарушением слуха и речи | ||
| Report title | ||
| Type of work | Source of funding | The product offerred for implementation |
| Applied | Программная документация | |
| Report authors | ||
| Еримбетова Айгерим Сембековна , Мамырбаев Оркен Жумажанович , Самбетбаева Мадина Аралбаевна , Амангелді Нұрзада , Кудубаева Сауле Альжановна , Бурибаев Жолдас Алладинович , Тұрдалыұлы Мұса , Бурибаева Айгерим Кеулимжаевна , Баекеева Айнур Толыбаевна , Бекарыстанқызы Ақбаян , Черикбаева Ляйля Шариповна , Оралбекова Дина Орымбаевна , Дүйсембай Серікболсын Бейбітұлы , Дайырбаева Эльмира Нурбеккызы , Тельман Думан Нұрланұлы , Қурметбек Бекболат , Бержанова Улмекен Габитқызы , Ерқос Айнұр , Назырова Айжан Есболовна , Сәкенов Бақжан Ерланұлы , Газизова Назерке Ерланқызы , Жасұзақ Мұхтар Сакенұлы , Бекбатыров Жангельды - , Әбдіразақ Земфира Бақытқызы , Miłosz Marek , Муталиев Елнур Аскарович , | ||
|
0
1
3
1
|
||
| Customer | МНВО РК | |
| Information on the executing organization | ||
| Short name of the ministry (establishment) | МНВО РК | |
| Full name of the service recipient | ||
| РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК | ||
| Abbreviated name of the service recipient | ИИВТ | |
| Abstract | ||
|
Объектом исследования в программе является процесс коммуникации между людьми с нарушением слуха и речи и слышащими людьми. Зерттеу бағдарламасындағы нысан – есту және сөйлеу қабілеті бұзылған адамдар мен еститін адамдар арасындағы коммуникация процесі. Целью текущего этапа программы является комплексная разработка и адаптация алгоритмов искусственного интеллекта и компьютерного зрения, направленных на обеспечение высокоточной идентификации и семантической интерпретации жестов казахского жестового языка в контексте их генерации 3D-аватарами. В рамках данного этапа также предусматривается создание системы синхронного перевода текстовой информации в жестовый язык, а также разработка системы автоматического распознавания речи на казахском языке с использованием современной нейронной архитектуры Conformer. Завершающим компонентом этапа является проведение всесторонней оценки качества и эффективности разработанных решений на основе установленных метрик точности, полноты и релевантности. Ағымдағы кезеңнің мақсаты – 3D-аватарлар арқылы қазақ тілі ымдарының жоғары дәлдікпен танылуын және мағыналық интерпретациясын қамтамасыз етуге бағытталған жасанды интеллект пен компьютерлік көру алгоритмдерін кешенді түрде әзірлеу және бейімдеу. Бұл кезең аясында мәтіндік ақпаратты ым тіліне синхронды түрде аударатын жүйені құру, сондай-ақ қазіргі заманғы Conformer нейрондық архитектурасын пайдалана отырып, қазақ тіліндегі сөйлеуді автоматты түрде тану жүйесін әзірлеу де көзделген. Кезеңнің соңғы бөлігі – әзірленген шешімдердің сапасы мен тиімділігін дәлдік, толықтық және релеванттылық көрсеткіштері негізінде жан-жақты бағалау болып табылады. Методы исследования, используются методы глубокого обучения, включая рекуррентные нейросети LSTM для анализа последовательностей ключевых точек, детектированных YOLOv8, а также мультимодальный подход с применением кластеризации для непрерывного распознавания жестов. Зерттеу әдістері ретінде терең оқыту әдістері қолданылады, соның ішінде YOLOv8 арқылы анықталған негізгі нүктелер тізбектерін талдау үшін LSTM рекурренттік нейрондық желілері, сондай-ақ ымдарды үздіксіз тануға арналған кластерлеуді қолданатын мультимодальды тәсіл пайдаланылады. Результаты за отчетный период: были разработаны, реализованы и апробированы алгоритмы автоматического распознавания жестов и их преобразования в текстовую и аудиоформу; подготовлен специализированный корпус КЖЯ из 2000 глосс и видеозаписей с профессиональными сурдопереводчикам; реализован модуль Text-to-Gloss, учитывающий морфосинтаксис КЖЯ и генерирующий корректные глоссовые последовательности; разработан алгоритм преобразования ключевых точек движений в анимацию 3D-аватара; собран и обработан корпус аудиоданных объемом 396 часов, записанных в естественных условиях; проведена автоматизированная очистка с устранением шума, ошибок разметки и лишних символов; обучена модель распознавания речи с использованием энкодера Conformer. Есептік кезеңдегі нәтижелер: Ымдарды автоматты түрде тану және оларды мәтіндік әрі аудио формаға түрлендіру алгоритмдері әзірленіп, жүзеге асырылып және апробациядан өткізілді; Кәсіби сурд-аудармашылардың қатысуымен 2000 глосс пен бейнежазбадан тұратын қазақтың ым тілі (КЖЯ) бойынша мамандандырылған корпус дайындалды; КЖЯ-ның морфосинтаксистік ерекшеліктерін ескеретін және дұрыс глосс тізбектерін қалыптастыратын Text-to-Gloss модулі жүзеге асырылды; Қозғалыстың негізгі нүктелерін 3D-аватар анимациясына түрлендіретін алгоритм әзірленді; Табиғи жағдайларда жазылған 396 сағаттық аудиодеректер корпусы жиналып, өңделді; Шуды, белгілеу қателіктерін және артық символдарды жоятын автоматтандырылған тазалау жүргізілді; Conformer энкодерін қолдана отырып, сөйлеуді тану моделі үйретілді. Разрабатываемая система демонстрирует высокие технические, экономические и социальные показатели, технология способствует улучшению доступа к информации и коммуникации для людей с нарушением слуха и речи, а также их интеграции в образовательные, профессиональные и социальные процессы. Проект поддерживает развитие казахского языка в цифровой среде, создавая инновационные ресурсы, которые укрепляют его позиции и способствуют развитию национальных технологий. Әзірленіп жатқан жүйе жоғары техникалық, экономикалық және әлеуметтік көрсеткіштерді көрсетеді, ұсынылған технология есту және сөйлеу қабілеті нашар адамдар үшін ақпарат пен коммуникацияға қолжетімділікті жақсартуға, сондай-ақ олардың білім беру, кәсіби және әлеуметтік процестерге интеграциялануына ықпал етеді. Жоба қазақ тілін цифрлық ортада дамытуды қолдайды, оның ұстанымын нығайтатын және ұлттық технологиялардың дамуына ықпал ететін инновациялық ресурстар жасайды. Внедрение результатов программы находится на стадии разработки, получено авторское свидетельство, что подтверждает эффективность системы и признание её в качестве объекта интеллектуальной собственности. Бағдарлама нәтижелерін енгізу даму сатысында, авторлық куәлік алынды, бұл жүйенің тиімділігін және оны зияткерлік меншік объектісі ретінде тануды растайды. Повышение доступности информации и улучшение взаимодействия для людей с нарушением слуха и речи способствует их более полной социальной и профессиональной интеграции. Разработанные алгоритмы и модели представляют собой передовое технологическое решение, объединяющее современные методы машинного обучения с учетом лингвистических особенностей жестовых языков. Созданный корпус данных на казахском и русском языках представляет собой ценный и уникальный ресурс, открывающий новые возможности для исследований в области обработки естественного языка и развития инклюзивных технологий. Ақпараттың қолжетімділігін арттыру және есту мен сөйлеу қабілеті бұзылған адамдармен тиімді коммуникация орнату – олардың әлеуметтік және кәсіби тұрғыда толыққанды интеграциялануына ықпал етеді. Әзірленген алгоритмдер мен модельдер – ым тілдерінің лингвистикалық ерекшеліктерін ескере отырып, заманауи машиналық оқыту әдістерін біріктіретін озық технологиялық шешім болып табылады. Қазақ және орыс тілдерінде құрылған деректер корпусы – табиғи тілді өңдеу және инклюзивті технологияларды дамыту бағытындағы болашақ зерттеулер үшін бірегей әрі құнды ресурс болып саналады. реабилитация и поддержка людей с нарушением слуха и речи, образование и профессиональное обучение для лиц с ограниченными возможностями, медицинская и социальная поддержка для улучшения качества жизни, развитие инклюзивной среды в общественных и рабочих пространствах, автоматизация коммуникации и адаптация информационных систем для нужд людей с нарушением слуха и речи. есту және сөйлеу қабілеті нашар адамдарды оңалту және қолдау, мүмкіндігі шектеулі жандарға білім беру және кәсіптік оқыту, өмір сүру сапасын жақсарту үшін медициналық және әлеуметтік қолдау, қоғамдық және жұмыс кеңістіктерінде Инклюзивті ортаны дамыту, коммуникацияны Автоматтандыру және есту және сөйлеу қабілеті нашар адамдардың қажеттіліктері үшін ақпараттық жүйелерді бейімдеу |
||
| UDC indices | ||
| 004.912; 004.93; 004.8; 004.5; 004.6 | ||
| International classifier codes | ||
| 28.23.00; 28.23.37; 28.23.25; | ||
| Readiness of the development for implementation | ||
| Key words in Russian | ||
| искусственный интеллект; технологии инклюзии; казахско-русский жестовый язык; распознавание жестов; сурдо-ресурсы; нарушение слуха; нарушение речи; синтез речи; распознавание речи; | ||
| Key words in Kazakh | ||
| жасанды интеллект; инклюзия технологиялары; қазақ-орыс ымдау тілі; ымдарды тану; сурдо-ресурстар; есту қабілетінің бұзылуы; сөйлеу қабілетінің бұзылуы; сөйлеу синтезі; сөйлеуді тану; | ||
| Head of the organization | Бектемесов М.А. | Доктор физ.-мат. наук / профессор |
| Head of work | Еримбетова Айгерим Сембековна | Доктор философии (PhD) / ассоциированный профессор |
| Native executive in charge | ||