| Inventory number | IRN | Number of state registration |
|---|---|---|
| 0225РК00792 | AP19577833-OT-25 | 0123РК00188 |
| Document type | Terms of distribution | Availability of implementation |
| Заключительный | Gratis | Number of implementation: 2 Implemented |
| Publications | ||
| Native publications: 2 | ||
| International publications: 2 | Publications Web of science: 0 | Publications Scopus: 2 |
| Number of books | Appendicies | Sources |
| 1 | 3 | 75 |
| Total number of pages | Patents | Illustrations |
| 154 | 0 | 60 |
| Amount of funding | Code of the program | Table |
| 24948933 | AP19577833 | 29 |
| Name of work | ||
| Исследование и разработка методов обучения и электронных ресурсов для детей с нарушением речи на основе технологии ИИ | ||
| Report title | ||
| Type of work | Source of funding | The product offerred for implementation |
| Applied | Методическая документация | |
| Report authors | ||
| Рахимова Диана Рамазановна , Турарбек Әсем Турарбекқызы , Кәрібаева Айдана Сейілғазықызы , Карюкин Владислав Игоревич , Төлеуғали Шадияр , Меркебаев Азат Галымжанулы , Дүйсенбекқызы Жансая , Бикен Мөлдір Ерікқызы , | ||
|
0
0
1
0
|
||
| Customer | МНВО РК | |
| Information on the executing organization | ||
| Short name of the ministry (establishment) | МНВО РК | |
| Full name of the service recipient | ||
| РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК | ||
| Abbreviated name of the service recipient | ИИВТ | |
| Abstract | ||
|
Объект исследования — речевые данные казахскоязычных детей дошкольного и младшего школьного возраста в контексте интеллектуальных логопедических и образовательных систем. Предмет исследования — методы и модели искусственного интеллекта для анализа, распознавания, синтеза и коррекции детской речи на казахском языке, а также разработка интерактивных обучающих ресурсов и цифровых платформ. Зерттеу нысаны – зияткерлік логопедиялық және білім беру жүйесі контекстіндегі қазақ тілді мектепке дейінгі және бастауыш мектеп жасындағы балалардың сөйлеу деректері. Зерттеу пәні – қазақ тіліндегі балалардың сөйлеуін талдау, тану, синтездеу және түзетуге арналған жасанды интеллект әдістері мен үлгілері, сондай-ақ интерактивті оқыту ресурстары мен цифрлық платформаларды әзірлеу. Исследование и разработка методов создания интеллектуальных систем для обучения и коррекции детской речи на казахском языке на основе технологий искусственного интеллекта, генеративных моделей и также разработка интерактивных обучающих ресурсов и цифровых платформ Жасанды интеллект технологиялары, генеративті модельдер негізінде қазақ тілінде балалардың сөйлеу тілін оқыту мен түзетудің интеллектуалды жүйелерін құру әдістерін зерттеу және әзірлеу, интерактивті оқыту ресурстары мен цифрлық платформаларды әзірлеу. Использованы методы машинного обучения, глубоких нейронных сетей, промт-инжиниринга, мультимодальной интеграции данных, семантического анализа (BERT, GPT, LLaMA), а также алгоритмы распознавания и синтеза речи (ESPnet, Whisper, Vosk, KazakhTTS). Зерттеуде машиналық оқыту, терең нейрондық желілер, өнеркәсіптік дизайн инженериясы, мультимодальды деректер интеграциясы, семантикалық талдау (BERT, GPT, LLaMA), сонымен қатар сөйлеуді тану және синтездеу алгоритмдері (ESPnet, Whisper, Vosk, KazakhTTS) пайдаланылды. - Разработана комплексная методика построения мультимедийных образовательных ресурсов на основе генеративных моделей нового поколения (GPT-4/5, Midjourney, Leonardo AI, CapCut AI, D-ID Studio). Внедрена гибридная архитектура генерации, объединяющая текстовые и визуальные ИИ-модули; -Создано 1178 медиаресурсов, в том числе 61 модуль, 452 урока, 52 групповых блока, 144 задания и 469 вариантов визуальных ответов; -Создан специализированный корпус детской речи (8214 записей, 5080 единиц); -Разработаны и обучены модели ASR/TTS с улучшением точности на 34 %; -Разработана интеллектуальная систем в веб-платформы LogopedAI.kz По результатам выполнения проекта за 2023-2025 года опубликованы 20 публикации: в зарубежных изданиях – публикации, индексируемых в базах данных WoS и/или Scopus – 5 публикации. Из них: одна статья опубликована в журнале Computers ( Scopus, процентиль 84, Q1), одна статья в журнале Applied Sciences (Scopus, процентиль 79, Q1); две статьи — в журнале Springer серии Communications in Computer and Information Science (Scopus, процентиль 39, Q3),одна статья - в журнале Springer серии Lecture Notes in Artificial Intelligence (Scopus, процентиль 46, Q3); В отечественных изданиях, рекомендуемые КОКСНВО МНВО РК – 3 публикации; Получены 4 авторских свидетельства на разработанные программы ЭВМ. Результаты исследовании прошли апробацию на международных конференциях и научных семинарах. - Заманауи генеративті модельдерге (GPT-4/5, Midjourney, Leonardo AI, CapCut AI, D-ID Studio) негізделген мультимедиялық білім беру ресурстарын құрудың кешенді әдістемесі әзірленді. Мәтіндік және визуалды ЖИ-модульдерді біріктіретін гибридті генерация архитектурасы енгізілді; - 1178 медиаресурс жасалды, оның ішінде 61 оқу модулі, 452 сабақ, 52 топтық блок, 144 тапсырма және 469 визуалды жауап нұсқасы; - Балалар сөйлеу корпусы құрылды (8214 жазба, 5080 бірлік); - ASR/TTS модельдері әзірленіп, оқытылды, тану дәлдігі 34 %-ға артты; - LogopedAI.kz веб-платформасы түрінде интеллектуалды жүйе жасалды. 2023–2025 жылдар аралығындағы жобаның нәтижелері бойынша 20 жарияланым жарық көрді: олардың ішінде шетелдік WoS және/немесе Scopus базаларында индекстелген – 5 мақала. Соның ішінде: бір мақала Computers журналында (Scopus, перцентиль 84, Q1), бір мақала Applied Sciences журналында (Scopus, перцентиль 79, Q1), екі мақала Springer CCIS сериясында (Scopus, перцентиль 39, Q3), бір мақала Springer LNAI сериясында (Scopus, перцентиль 46, Q3). Қазақстандағы КОКСНВО ұсынған отандық басылымдарда – 3 мақала. Сонымен қатар 4 авторлық куәлік алынды. Расходование средств финансирования производится согласно утвержденной смете. Платформа LogopedAI.kz поддерживает более 100 одновременных пользователей, среднее время отклика 1,9–2,4 с, уровень экспертной оценки 4,7 из 5. Производительность генерации медиаресурсов увеличена в 5 раз, снижение WER до 0,48 и CER до 0,26. Қаражат жұмсауы бекітілген сметаға сәйкес жүзеге асырылады. LogopedAI.kz платформасы бір уақытта 100-ден астам пайдаланушыны қолдай алады. Орташа жауап беру уақыты 1,9–2,4 секунд, ал сарапшылар бағасы 5 балдың ішінде 4,7 баллды құрайды. Медиаресурстарды генерациялау өнімділігі 5 есеге артты, сөйлеуді тану дәлдігі жақсарып, WER 0,48, CER 0,26 деңгейіне дейін төмендеді. Результаты внедрены в дошкольных учреждениях г. Алматы — ГККП «Ясли-сад № 154» и «Sabira-A». Разработанные ресурсы применяются в логопедической и методической работе, интегрированы в образовательные и диагностические процессы. Жобаның нәтижелері Алматы қаласының мектепке дейінгі мекемелерінде — №154 балабақша және «Sabira-A» балабақшасында — тәжірибелік түрде енгізілді. Әзірленген ресурстар логопедиялық және әдістемелік жұмыстарда қолданылады, сондай-ақ оқу және диагностикалық үдерістерге интеграцияланды. Разработанные алгоритмы и технологии были программно протестированы, а эффективность полученных результатов оценивалась с применением специализированных метрик — WER (Word Error Rate), CER (Character Error Rate), Precision, Recall, F1-score, ROUGE-L, METEOR, а также показателя экспертной согласованности Флейсса Каппа. Комплексное тестирование показало высокие показатели качества распознавания и генерации речи: снижение CER до 0,26, улучшение WER на 34 %, средние значения Precision и Recall превысили 0,9, при этом F1-score составил 0,127. Экспертная оценка (κ = 0,67) подтвердила достоверность и устойчивость результатов. Разработанная технология, включающая модели, алгоритмы и мультимедийные ресурсы, реализована с применением методов нейронного и глубокого обучения, адаптированных под фонетико-морфологические особенности казахского языка. Әзірленген алгоритмдер мен технологиялар бағдарламалық түрде тестіленіп, нәтижелердің тиімділігі арнайы метрикалар арқылы бағаланды: WER (Word Error Rate), CER (Character Error Rate), Precision, Recall, F1-score, ROUGE-L, METEOR, сондай-ақ сарапшылардың келісімділік көрсеткіші — Флейсс Каппа. Кешенді сынақ нәтижесінде сөйлеуді тану және генерация сапасының жоғары көрсеткіштері алынды: CER 0,26-ға дейін төмендеді, WER 34 %-ға жақсарды, орташа Precision және Recall мәндері 0,9-дан асты, ал F1-score — 0,127 деңгейінде. Сараптамалық баға (κ = 0,67) нәтижелердің сенімділігін және тұрақтылығын растады. Әзірленген технология — модельдер, алгоритмдер және мультимедиялық ресурстар кешені — қазақ тілінің фонетикалық және морфологиялық ерекшеліктеріне бейімделген нейрондық және терең оқыту әдістері негізінде жүзеге асырылды Разработанные модели и системы, полученные результаты проекта в дальнейшем могут быть применены в различных интеллектуальных информационных системах с поддержкой государственного языка для детей дошкольного и школьного возраста . А также полученные результаты и ресурсы будут полезны для научных сотрудников, логопед-дефектологов и ИТ специалистов. Ожидаемый социальный, экономический и мультипликативный эффект проекта состоит в решении важной социально-значимой задачи получения электронных ресурсов и программного инструментария, которые могут применены в обучении и развитии детей с нарушением речи на казахском языке. Потребителями разработанных ресурсов будут все слои населения Казахстана, а так же может быть доступно для многих родителей и применены в работе у специалистов по коррекции речи. Әзірленген үлгілер мен жүйелер, жобаның алынған нәтижелері мектепке дейінгі және мектеп жасындағы балаларға арналған мемлекеттік тілде сөйлеуді үйренуге арналған әртүрлі интеллектуалды ақпараттық жүйелерде қолданылуы мүмкін. Алынған нәтижелер мен ресурстар зерттеушілерге, логопедтерге, дефектологтарға және IT мамандарына да пайдалы болады. Жобаның күтілетін әлеуметтік, экономикалық және мультипликативті әсері – сөйлеу қабілеті бұзылған балаларды қазақ тілінде оқыту мен дамытуда қолдануға болатын электрондық ресурстар мен бағдарламалық құралдарды алудың маңызды әлеуметтік қолдауы болып табылады. Әзірленген ресурстардың тұтынушылары Қазақстан халқының барлық топтары болады, сонымен қатар ол көптеген ата-аналарға қол жетімді және сөйлеуді түзету мамандарының жұмысында қолданылуы мүмкін |
||
| UDC indices | ||
| 004.421, 004.912 | ||
| International classifier codes | ||
| 20.00.00; 28.23.00; | ||
| Readiness of the development for implementation | ||
| Key words in Russian | ||
| казахский язык; нарушение речи; электронные ресурсы; логопедия; искусственный ителлект; | ||
| Key words in Kazakh | ||
| қазақ тілі; сөйлеудің бұзылуы; электрондық ресурстар; логопедия; жасанды ителлект; | ||
| Head of the organization | Мутанов Галимкаир Мутанович | Доктор технических наук / профессор |
| Head of work | Рахимова Диана Рамазановна | PhD / Ассоциированный профессор |
| Native executive in charge | ||