| Inventory number | IRN | Number of state registration | ||
|---|---|---|---|---|
| 0325РК00659 | AP23489504-KC-25 | 0124РК00702 | ||
| Document type | Terms of distribution | Availability of implementation | ||
| Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
| Publications | ||||
| Native publications: 2 | ||||
| International publications: 4 | Publications Web of science: 0 | Publications Scopus: 1 | ||
| Patents | Amount of funding | Code of the program | ||
| 0 | 42915308.1 | AP23489504 | ||
| Name of work | ||||
| Технология создания сайтов с адаптивным дизайном и функцией для слабовидящих: озвучивание информации сайта через синтезатор казахской речи | ||||
| Type of work | Source of funding | Report authors | ||
| Applied | Ергеш Бану Жантуғанқызы | |||
|
0
1
2
0
|
||||
| Customer | МНВО РК | |||
| Information on the executing organization | ||||
| Short name of the ministry (establishment) | МНВО РК | |||
| Full name of the service recipient | ||||
| Некоммерческое акционерное общество "Евразийский Национальный университет имени Л.Н. Гумилева" | ||||
| Abbreviated name of the service recipient | НАО "ЕНУ им.Л.Н.Гумилева" | |||
| Abstract | ||||
|
казахский язык, технология автоматизированного создания веб-сайтов, казахский речевой синтезатор, адаптивный дизайн. қазақ тілі, автоматтандырылған веб-сайттар жасау технологиясы, қазақ тіліндегі сөйлеу синтезаторы, бейімделген дизайн. Разработка технологии автоматического создания сайтов с адаптивным дизайном и со встроенной функцией синтезатора казахской речи, которая озвучивает контент сайта на казахском языке. Веб-сайт мазмұнын қазақ тілінде оқитын, бейімделген дизайны және кіріктірілген қазақ тілінде сөйлеу синтезаторы функциясы бар веб-сайттарды автоматты түрде құру технологиясын әзірлеу. В рамках проекта применялись лингвистические методы анализа фонетики, фонотактики и интонации казахского языка, а также семантическая разметка для определения пауз и акцентов. Использовались инструменты обработки аудио (VAD, шумоподавление, Whisper). Разработка платформы и анимационного персонажа выполнялась с применением микросервисной архитектуры и мультимодальных технологий, включая Wav2Lip. Жобаны жүзеге асыру барысында қазақ тілінің фонетикасын, фонотактикасын және интонациясын талдау үшін лингвистикалық әдістер, сондай-ақ кідірістер мен екпіндерді анықтау үшін семантикалық белгілеу қолданылды. Дыбысты өңдеу құралдары (VAD, шуды азайту, Whisper) де пайдаланылды. Платформа мен анимациялық кейіпкер микросервис архитектурасы мен Wav2Lip қоса алғанда, мультимодальды технологияларды қолдана отырып жасалған. В отчетном периоде выполнены исследования и разработки в области синтеза казахской речи, транскрипции и интонационного моделирования. Создана фонологическая модель транскриптора, формализованы фонетические правила, выполнено тестирование и корректировка транскрипции. Фонологическая модель транскриптора учитывает реальные фонетические характеристики казахского языка (ударение, ассимиляция, структура слогов, позиционные вариации). Разработана методика интонационной разметки на основе семантической информации, изучены паузы, ударения и логические акценты различных типов предложений. Проведена интонационная разметка результатов обработки текстового процессора на основе семантической информации. Разработаны и апробированы алгоритмы выделения интонационных паттернов казахской речи, отражающих логико-семантическую структуру предложений. Методика интонационной разметки на основе семантической информации повышает естественность и ясность синтезируемой речи. Создан анимационный персонаж с мимикой, управляемой интонационными характеристиками речи, интегрирован Wav2Lip и реализованы оптимизированные сценарии анимации. Анимированный персонаж визуально отражает интонационно-эмоциональные особенности синтезируемого речевого потока. Получено 1 авторское свидетельство, опубликованы статьи в международных конференциях, индексированные в IEEE Xplore и отечественных изданиях, одна статья принята в рецензируемый журнал. Есепті кезеңде қазақ сөйлеу синтезі, транскрипция және интонациялық модельдеу салаларында зерттеулер мен әзірлемелер жүргізілді. Транскриптордың фонологиялық моделі жасалды, фонетикалық ережелер дайындалды, транскрипцияны тексеру және түзету жүргізілді. Транскриптордың фонологиялық моделі қазақ тілінің нақты фонетикалық құбылыстарын (екпін, ассимиляция, буындық құрылым, позициялық вариациялар) ескереді. Семантикалық ақпаратқа негізделген интонациялық белгілеу әдісі жасалды, әртүрлі сөйлем түрлерінің кідірістері, екпіндері және логикалық акценттері зерттелді. Мәтіндік процессорды өңдеу нәтижелерінің интонациялық белгілеуі семантикалық ақпаратқа негізделген. Сөйлемдердің логикалық және семантикалық құрылымын көрсететін қазақ сөйлеуінің интонациялық үлгілерін алу алгоритмдері әзірленіп, сынақтан өткізілді. Семантикалық ақпаратқа негізделген интонациялық белгілеудің бұл әдісі синтезделген сөйлеудің табиғилығы мен түсініктілігін жақсартады. Сөйлеу интонациясының сипаттамаларымен басқарылатын мимикасы бар анимациялық кейіпкер жасалды, Wav2Lip интеграцияланды және оңтайландырылған анимациялық сценарийлер енгізілді. Анимациялық кейіпкер синтезделген сөйлеу ағымының интонациялық және эмоционалдық сипаттамаларын көрнекі түрде көрсетеді. 1 (бір) авторлық құқық куәлігі алынды, IEEE Xplore халықаралық конференциялар жинақтарында және отандық журналдарда мақалалар жарияланды, ал бір мақала рецензияланатын журналға қабылданды. В 2025 году разработаны основные компоненты системы синтеза и обработки казахской речи. Создана фонологическая модель транскриптора, включающая формализованные фонетические правила. Транскриптор обеспечивает корректное преобразование текста в транскрипционную запись. Разработана методика интонационной разметки на основе семантической структуры предложения. Создан анимационный персонаж с мимикой, управляемой интонационными характеристиками речи, интегрирована технология Wav2Lip и оптимизирована генерация анимации. Разработана веб-платформа с модулями для записи, транскрипции, разметки, конвертации и оценки речи. Платформа построена на микросервисной архитектуре с использованием Docker Swarm и RabbitMQ. Для повышения качества работы добавлены инструменты проверки аудио и методы сглаживания стыков (fade-in/fade-out), что обеспечило стабильную и плавную обработку данных. Получено 1 авторское свидетельство. Опубликованы: – 5 статья в материалах международных конференций(в том числе IEEEXplore), из них 1 статья индексирована в Scopus – 1 статья в отечественном издании КОКНВО. Принята 1 статья в журнал индексируемый в Web of Science и/или Scopus. 2025 жылы қазақ сөйлеу синтезі және өңдеу жүйесінің негізгі компоненттері жасалды. Формалданған фонетикалық ережелерді қамтитын транскриптордың фонологиялық моделі жасалды. Транскриптор мәтінді транскрипцияға дұрыс түрлендіруді қамтамасыз етеді. Сөйлемнің семантикалық құрылымына негізделген интонациялық белгілеу әдісі жасалды. Сөйлеудің интонациялық сипаттамаларымен басқарылатын мимикасы бар анимациялық кейіпкер жасалды, Wav2Lip технологиясы біріктірілді және анимация генерациясы оңтайландырылды. Сөйлеуді жазу, транскрипциялау, белгілеу, түрлендіру және бағалау модульдері бар веб-платформа жасалды. Платформа Docker Swarm және RabbitMQ пайдаланатын микросервис архитектурасына негізделген. Өнімділікті жақсарту үшін дыбысты тексеру құралдары және біртіндеп енгізу/сөндіру әдістері қосылды, бұл деректерді тұрақты және бірқалыпты өңдеуді қамтамасыз етеді. 1 (бір) авторлық куәлік алынды. Жарияланғандар: - Халықаралық конференция материалдарында 5 мақала (соның ішінде IEEEXplore), оның ішінде 1 мақала Scopus-та индекстелген - ҒЖБССҚК ұсынған рецензияланған отандық журналда 1 мақала. 1 мақала Web of Science және/немесе Scopus базаларында индекстелген журналға қабылданды. Не требует внедрения. Енгізуді талап етпейді. Реализация проекта создаст условия для равного доступа к информации для всех групп пользователей, повысит качество образовательных услуг и окажет положительное влияние на социальную среду. Экономическая эффективность будет достигнута за счет сокращения затрат на разработку веб-ресурсов и повышения их доступности, что в конечном итоге улучшит имидж Казахстана на международной арене. Жобаны жүзеге асыру барлық пайдаланушылар топтары үшін ақпаратқа тең қолжетімділік үшін жағдай жасайды, білім беру қызметтерінің сапасын арттырады және әлеуметтік ортаға оң әсер етеді. Экономикалық тиімділікке веб-ресурстарды әзірлеу шығындарын азайту және олардың қолжетімділігін арттыру арқылы қол жеткізіледі, бұл сайып келгенде Қазақстанның халықаралық аренадағы имиджін жақсартуға мүмкіндік береді. Инженерия и технологии, цифровые технологии, искусственный интеллект, казахстанское общество, образовательная сфера, организации, использующие сайты с адаптивным дизайном и озвучиванием. Инженерия және технологиялар, цифрлық технологиялар, жасанды интеллект, қазақстандық қоғам, білім беру саласы, адаптивті дизайны мен дыбыстық оқуы бар веб-сайттарды пайдаланатын ұйымдар. |
||||
| UDC indices | ||||
| 004.8, 81'322 | ||||
| International classifier codes | ||||
| 16.31.02; 28.23.02; | ||||
| Key words in Russian | ||||
| Искусственный интеллект; Синтез речи; Веб-технологии; Адаптивный дизайн; функция для слабовидящих; инклюзия; | ||||
| Key words in Kazakh | ||||
| Жасанды интеллект; сөйлеу синтезі; Веб-технологиялар; адаптивті дизайн; нашар көретіндерге арналған функция; инклюзия; | ||||
| Head of the organization | Сыдыков Ерлан Батташевич | доктор исторических наук / Профессор | ||
| Head of work | Ергеш Бану Жантуғанқызы | Phd / - | ||