Inventory number IRN Number of state registration
0225РК01354 BR28713313-OT-25 0125РК01044
Document type Terms of distribution Availability of implementation
Промежуточный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 0 Publications Web of science: 0 Publications Scopus: 0
Number of books Appendicies Sources
1 2 155
Total number of pages Patents Illustrations
175 0 19
Amount of funding Code of the program Table
110000000 Ф.1493 6
Code of the program's task under which the job is done
01
Name of work
Создание интеллектуальной вычислительной модели автоматизации решения задач с использованием ресурсов суперкомпьютеров с приложениями в биоинформатике и квантовых вычислениях
Report title
Type of work Source of funding The product offerred for implementation
Applied Автоматизированная система
Report authors
Мухамбетжанов Салтанбек Талапеденович , Иманкулов Тимур Сакенович , Лебедев Данил Владимирович , Нурахов Едиль , Бурибаев Жолдас Алладинович , Ерқос Айнұр , Шинасылов Шона Жораевич , Қасымбек Нұрислам Мұратбекұлы , Кенжебек Ержан Ғалымжанұлы , Муханбет Ақсултан Айтуарұлы , Мустафин Максат Бейбитович , Марламбеков Думан Дулатович , Азатбекұлы Нұртуган , МАХМУТ ЕРЛАН , Есенғалиева Гүлназым Темірханқызы , Амиртаева Айнұр Қанатқызы , Шаймерден Мейрамбек Кенжебекұлы , Иманбек Рустем Кадырбекулы , Жетпісбай Жібек Ерболқызы , Перепёлкин Владислав Александрович , Городничев Максим Александрович , Салыбеков Аманкелді Алшынбекұлы , Дарибаев Беимбет Серикович , Bekele Samson Dawit , Маткаримов Бахыт Турганбаевич , Жумадиллаева Айнур Канадиловна , Ашимгалиев Медет Жумабаевич , Жунусова Гульнур Сагиндыковна ,
0
3
3
2
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Некоммерческое акционерное общество "Казахский национальный университет имени аль-Фараби"
Abbreviated name of the service recipient НАО "КазНУ им. аль-Фараби"
Abstract

Объектами исследования являются: архитектура систем управления активными знаниями, методы автоматического синтеза параллельных программ, национальные биомедицинские репозитории, массивы мультиомных данных (геномика, транскриптомика), технологии распределенного хранения (HDFS, PostgreSQL, MongoDB), контейнеризация (Docker, Kubernetes), а также гибридные квантовые физически-информированные нейронные сети (Quantum PINN) и их архитектуры для решения дифференциальных уравнений.

Зерттеу тақырыптарына мыналар кіреді: белсенді білімді басқару жүйелерінің архитектурасы, параллель бағдарламаларды автоматты түрде синтездеу әдістері, ұлттық биомедициналық репозиторийлер, мультиомика деректер жиынтығы (геномика, транскриптомика), таратылған сақтау технологиялары (HDFS, PostgreSQL, MongoDB), контейнерлеу (Docker, Kubernetes), сондай-ақ гибридті кванттық физикалық ақпараттандырылған нейрондық желілер (Quantum PINN) және олардың дифференциалдық теңдеулерді шешуге арналған архитектуралары.

Цель работы: Разработка архитектурных и программных решений для создания интеллектуальных систем управления знаниями в HPC, построение Национального репозитория биомедицинских данных и проектирование гибридных квантовых моделей для решения наукоемких задач.

Мақсаты: HPC-де интеллектуалды білімді басқару жүйелерін құру, Ұлттық биомедициналық деректер репозиторийін құру және білімді көп қажет ететін мәселелерді шешуге арналған гибридті кванттық модельдерді жобалау үшін архитектуралық және бағдарламалық шешімдерді әзірлеу.

Методы исследования: Применен системный анализ подходов к оркестрации вычислений (Workflow-системы, Semantic Web) и теория синтеза программ на вычислительных моделях. Использованы методы микросервисной архитектуры и технологии Big Data (HDFS, Spark) для проектирования репозитория. Применены биоинформатические алгоритмы (GATK, PLINK, ADMIXTURE) для анализа данных секвенирования. Проведено численное моделирование и сравнительный анализ классических и квантовых нейронных сетей (QPINN) с использованием фреймворков PennyLane и PyTorch для решения уравнений в частных производных.

Зерттеу әдістері: Есептеу оркестрлеу тәсілдерінің жүйелік талдауы (жұмыс ағыны жүйелері, Semantic Web) және есептеу модельдеріне негізделген бағдарлама синтезі теориясы қолданылды. Репозиторийлерді жобалау үшін микросервис архитектурасының әдістері және үлкен деректер технологиялары (HDFS, Spark) қолданылды. Реттік деректерді талдау үшін биоинформатика алгоритмдері (GATK, PLINK, ADMIXTURE) қолданылды. Классикалық және кванттық нейрондық желілердің (QPINN) сандық модельдеуі және салыстырмалы талдауы ішінара дифференциалдық теңдеулерді шешу үшін PennyLane және PyTorch шеңберлерін пайдалану арқылы жүргізілді.

Результаты работы: Разработана архитектура системы автоматизации суперкомпьютерного моделирования на основе активных знаний, реализующая автоматический вывод VW-плана с учетом нефункциональных свойств. Спроектирован и частично реализован Национальный репозиторий биоданных, внедрен подход Polyglot Persistence для хранения разнородных данных (клинических, геномных, экологических). Собраны и структурированы наборы данных по социально значимым заболеваниям (онкология, астма) в Казахстане. Разработана архитектура гибридной квантовой нейросети (HQPINN) с угловым кодированием и мультипликативным связыванием, показавшая преимущество в точности и параметрической эффективности при моделировании ударных волн (уравнение Бакли-Леверетта) по сравнению с классическими PINN.

Нәтижелер: Белсенді білімге негізделген автоматтандырылған суперкомпьютерлік модельдеу жүйесінің архитектурасы жасалды, функционалды емес қасиеттерді ескере отырып, VW жоспарын автоматты түрде шығаруды жүзеге асырады. Ұлттық биодеректер қоймасы жасалды және ішінара енгізілді, сондай-ақ гетерогенді деректерді (клиникалық, геномдық және экологиялық) сақтауға арналған Polyglot Persistence тәсілі енгізілді. Қазақстандағы әлеуметтік маңызы бар аурулар (онкология, астма) бойынша деректер жиынтығы жиналды және құрылымдалды. Бұрышты кодтау және мультипликативті байланысы бар гибридті кванттық нейрондық желі (HQPINN) архитектурасы жасалды. Ол классикалық PINN-дермен салыстырғанда соққы толқындарын модельдеу кезінде (Бакли-Леверетт теңдеуі) жоғары дәлдік пен параметрлік тиімділікті көрсетеді.

Основные конструктивные и технико-экономические показатели на первом году состоят в разработке архитектуры системы автоматизации суперкомпьютерного моделирования на основе активных знаний и гибридной квантово-классической архитектуры HQPINN для решения задач моделирования двухфазных течений.

Бірінші жылдағы негізгі жобалау және техникалық-экономикалық көрсеткіштер белсенді білімге негізделген суперкомпьютерлік модельдеуді автоматтандыру жүйесінің архитектурасын және екі фазалы ағындарды модельдеу есептерін шешуге арналған HQPINN гибридті кванттық-классикалық архитектурасын әзірлеуден тұрады.

не внедрено

ендірілмеген

Эффективность работ первого года заключается в создании целостной архитектуры системы автоматизации суперкомпьютерного моделирования на основе активных знаний и гибридных квантово-классических моделей HQPINN, что обеспечивает методологическую и технологическую готовность к последующим этапам проекта. Проведённый аналитический обзор и формализация моделей позволили снизить риски последующей разработки, унифицировать представление вычислительных задач и их нефункциональных характеристик, обеспечить масштабируемость решений на существующие HPC-ресурсы

Бірінші жылғы жұмыстың тиімділігі белсенді білімге және гибридті кванттық-классикалық HQPINN модельдеріне негізделген автоматтандырылған суперкомпьютерлік модельдеу жүйесінің кешенді архитектурасын жасауда жатыр, бұл жобаның кейінгі кезеңдеріне әдіснамалық және технологиялық дайындықты қамтамасыз етеді. Модельдерді аналитикалық шолу және формализациялау кейінгі әзірлеу тәуекелдерін азайтты, есептеу тапсырмаларының және олардың функционалды емес сипаттамаларының көрінісін біріктірді және қолданыстағы HPC ресурстарындағы шешімдердің масштабталуын қамтамасыз етті.

Область применения результатов: Национальная суперкомпьютерная инфраструктура, системы здравоохранения и персонализированной медицины Республики Казахстан, нефтегазовая отрасль (гидродинамическое моделирование пластов), научные исследования в области биоинформатики и вычислительной физики.

Жоспарланған қолданылу салалары: Ұлттық суперкомпьютерлік инфрақұрылым, Қазақстан Республикасының денсаулық сақтау және дербестендірілген медицина жүйелері, мұнай-газ өнеркәсібі (резервуарлық модельдеу) және биоинформатика және есептеу физикасы саласындағы зерттеулер.

UDC indices
004.032.2, 575.112
International classifier codes
20.00.00; 50.37.00;
Readiness of the development for implementation
Key words in Russian
Суперкомпьютерные вычисления; Квантовые технологии; Биоинформатика; Активные знания; Национальный репозиторий данных;
Key words in Kazakh
Суперкомпьютерлік есептеулер; Кванттық технологиялар; Биоинформатика; Белсенді білім; Ұлттық деректер қоймасы;
Head of the organization Ибраимов Маргулан Касенович Phd / ассоциированный профессор
Head of work Мухамбетжанов Салтанбек Талапеденович доктор физико-математичских наук / профессор
Native executive in charge