Inventory number IRN Number of state registration
0324РК01936 AP22686112-KC-24 0124РК00298
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 0 Publications Web of science: 0 Publications Scopus: 0
Patents Amount of funding Code of the program
0 9938660 AP22686112
Name of work
Исследование соматических мутаций по данным одноклеточной РНК с использованием методов машинного обучения у пациентов с заболеванием периферических артерий
Type of work Source of funding Report authors
Applied Куникеев Айдын Даулетович
0
1
1
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Некоммерческое акционерное общество "Казахский Национальный Исследовательский технический университет имени К.И. Сатпаева"
Abbreviated name of the service recipient НАО «КазНИТУ им. К.И. Сатпаева»
Abstract

пациенты с заболеванием периферических артерий (ЗПА), который входит в группу сердечно-сосудистые заболевания (ССЗ)

жүрек-қан тамырлары ауруларымен (ЖТА) құрамына кіретін, перифериялық артерия аурулары (ПАА) бар пациенттер

Основная цель этого исследования — создать инклюзивный pipeline для выявления соматических мутаций у пациентов с заболеванием периферических артерий (ЗПА) с использованием таких инструментов, как Gemini, Cosmic и Monocle, а также различных методов машинного обучения. Цель первого года: просмотреть и написать обзорную статью об инструментах предварительных вычислений и инструментах кластеризации экспрессии генов.

Бұл зерттеудің негізгі мақсаты - Gemini, Cosmic және Monocle сияқты құралдар және әртүрлі машиналық оқыту әдістерін пайдалана отырып, перифериялық артерия ауруы (ПАА) бар пациенттеріндегі соматикалық мутацияларды анықтау үшін инклюзивті pipeline құру. Бірінші жылдың мақсаты: Алдын ала есептеу құралдарына шолу жасау және солар бойынша және ген экспрессиясын кластерлеу құралдары бойынша шолу қағазын жазу.

Для реализации исследования используется подход с экспериментальной и контрольной группами пациентов (с ранами и здоровые соответственно), основанный на методах машинного обучения, включая техники уменьшения размерности и кластеризации, для выявления значимых взаимосвязей между группами. Предварительная обработка и кластеризация данных в формате FASTQ осуществляется с помощью инструментов GalaxyProject (Hisat2, BWA-MEM, DESeq2, Featurecounts, CufDiff, Gemini, Cosmic), а для других форматов используются Seurat и scanpy. Поиск путей развития и соматических мутаций проводится с помощью Monocle после идентификации релевантных генов и клеток. Данные получаются из открытых источников NCBI и ENA, что исключает этические вопросы. Экспериментальная часть включает сбор данных различных форматов (FASTQ, AnnData, hd5), их обработку с использованием CellRanger при объединении форматов и проведение кластерного анализа экспрессии генов. Завершающим этапом является анализ соматических мутаций и путей у нелеченых пациентов с последующим сравнением результатов с данными GWAS, при этом эффективность моделей оценивается по специальным ключевым показателям.

Зерттеуді жүзеге асыру үшін топтар арасындағы маңызды қарым-қатынастарды анықтау үшін өлшемді азайту және кластерлеу әдістерін қамтитын машиналық оқыту әдістеріне негізделген (тиісінше жаралары бар және сау адамдар) пациенттердің эксперименттік және бақылау топтарымен тәсіл қолданылады. FASTQ пішіміндегі деректерді алдын ала өңдеу және кластерлеу GalaxyProject құралдарының (Hisat2, BWA-MEM, DESeq2, Featurecounts, CufDiff, Gemini, Cosmic) көмегімен жүзеге асырылады, ал басқа форматтар үшін Seurat және scanpy қолданылады. Даму жолдары мен соматикалық мутацияларды іздеу сәйкес гендер мен жасушаларды анықтағаннан кейін Monocle көмегімен жүзеге асырылады. Деректер NCBI және ENA қоғамдық көздерінен алынған, бұл этикалық мәселелерді жоққа шығарады. Эксперименттік бөлім әртүрлі пішімдерде деректерді жинауды (FASTQ, AnnData, hd5), пішімдерді біріктіру кезінде CellRanger көмегімен өңдеуді және ген экспрессиясының кластерлік талдауын жүргізуді қамтиды. Соңғы қадам емделмеген пациенттердегі соматикалық мутациялар мен жолдарды талдау болып табылады, содан кейін нәтижелерді GWAS деректерімен салыстыру, ал модельдердің өнімділігі нақты негізгі көрсеткіштер арқылы бағаланады.

На современном этапе исследований загружены оптимальные методы подготовки генетических данных для кластерного анализа (выполненные на сверхвысокопроизводительной вычислительной технике, документы об аренде высокопроизводительной вычислительной техники. С помощью этих инструментов были получены кластеры с использованием экспрессии генов и различных алгоритмы кластеризации) и по этому поводу написана обзорная статья (25 декабря 2024 года она будет опубликована в Вестнике КБТУ, так как встать в очередь очень сложно, и статья стала возможной только после финансирование получено). В результате этой работы нам удалось проанализировать пути развития генов и выявить мутации на следующем этапе.

Зерттеудің қазіргі кезеңінде кластерлік талдау (Өте жоғары есептеу құраладырмен жасалды, жоғары есептеу құралдарын жалға алу құжаттары жүктелген. Бұл құралдармен гендік экспрессияны және түрлі кластерлерлеу алгоритмдері арқылы кластерлер алынды) үшін генетикалық мәліметтерді дайындаудың оңтайлы әдістері әзірленді, осыған байланысты шолу мақаласы жазылды (25-ші желтоқсан 2024-ші жылы КБТУ вестник журналында жарияланады, себебі кезектерге іліну өте қиын және мақаланы тек қаржыландыру түскннен кейін ғана жасау мүмкін болды). Осы жұмыстың нәтижесінде келесі кезеңі гендердің даму жолдарын талдауға және мутацияларды анықтауға мүмкіндік алдық.

Pipeline позволяет быстро определять гены, связанные с ЗПА и ССЗ, ускоряя поиск методов лечения и обеспечивая возможность использования экономичной ПЦР вместо дорогого секвенирования. Раннее выявление заболеваний предотвращает развитие тяжелых форм, снижает потребность в дорогостоящем лечении и операциях, улучшая здоровье населения и экономя государственные средства. Точная идентификация генов позволяет заменить дорогое секвенирование на экономичное ПЦР-тестирование.

Pipeline ЖТА және ПАА -мен байланысты гендерді жылдам анықтауды, емдеу әдістерін іздеуді жеделдетеді және қымбат секвенирлеудің орнына үнемді ПЦР қолдануға мүмкіндік береді. Ауруларды ерте анықтау, ауыр түрлерінің дамуын болдырмайды, қымбат емдеу мен операцияларды қажет етпейді, халықтың денсаулығын жақсартады және мемлекет қаражатын үнемдейді. Гендерді дәл анықтау қымбат секвенирлеуді үнемді ПЦР тестімен ауыстыруға мүмкіндік береді.

На этапе исследования и разработки эффективного pipeline для определения генетических факторов сердечно-сосудистых заболеваний (ССЗ), включающий заболевания периферических артерий (ЗПА).

ПАА-ны қамтитын ЖТА генетикалық негізін анықтау үшін тиімді pipeline зерттеу және құру кезеңінде

Эффективность pipeline заключается в точности, скорости обработки, также анализе генетических данных, что позволяет более быстро и точно идентифицировать и классифицировать гены, тракторию развития и мутацию генов. Оптимизированный и точный pipeline обеспечивает её устойчивость и актуальность в долгосрочной перспективе

Pipeline тиімділігі гендерді, даму траекториясын және гендік мутацияны тезірек және дәлірек анықтауға және жіктеуге мүмкіндік беретін генетикалық мәліметтердің дәлдігінде, өңдеу жылдамдығында және талдауында жатыр. Оңтайландырылған және дәл pipeline оның ұзақ мерзімді перспективада тұрақтылығы мен өзектілігін қамтамасыз етеді

Полученные результаты представляют ценность для: Научных сотрудников различной квалификации, включая магистрантов и докторантов, проводящих исследования схожих заболеваний и их генетических основ. Медицинских специалистов при интерпретации результатов генетических исследований пациентов с аналогичными заболеваниями.

Алынған нәтижелер мыналар үшін құнды: 1. Әртүрлі біліктіліктегі зерттеушілер, соның ішінде магистранттар мен докторанттар, ұқсас аурулар және олардың генетикалық негіздері бойынша зерттеулер жүргізе алады. 2. Ұқсас аурулары бар науқастардың генетикалық зерттеулерінің нәтижелерін түсіндіру кезінде медицина мамандарына.

UDC indices
004.9
International classifier codes
20.00.00; 20.01.00;
Key words in Russian
Машинное обучение; Биоинформатика; Исскуственный интеллект; Одноклеточный анализ; Соматическая мутация;
Key words in Kazakh
Машиналық оқыту; Биоинформатика; Жасанды интеллект; Бір жасушалық талдау; Соматикалық мутация;
Head of the organization Кульдеев Ержан Итеменович Кандидат технических наук РК, кандидат технических наук РФ / профессор
Head of work Куникеев Айдын Даулетович / Магистр техники и технологии