Inventory number IRN Number of state registration
0325РК00266 AP23490594-KC-25 0124РК00829
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 2 Publications Web of science: 2 Publications Scopus: 0
Patents Amount of funding Code of the program
0 42985351.8 AP23490594
Name of work
Хромосомная сборка полных геномов индивидуумов казахской популяции c применением современных геномных технологий
Type of work Source of funding Report authors
Fundamental Каиров Улыкбек Еруланович
0
0
2
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) Нет
Full name of the service recipient
Частное учреждение "National Laboratory Astana"
Abbreviated name of the service recipient National Laboratory Astana
Abstract

Геномные данные индивидуумов казахской популяции

Қазақ популяциясы дараларының геномдық деректері

Основная цель проекта заключается в создании хромосомной сборки полных геномов индивидуумов казахской популяции с применением данных длинных и коротких сиквенсовых прочтений, а также данных оптических геномных карт bionano и хромосомной конформации Hi-C.

Жобаның негізгі мақсаты ұзақ және қысқа сиквенстік оқылым деректерін, сондай-ақ bionano оптикалық геномдық карталарының деректерін және Hi-C хромосомалық конформациясын пайдалана отырып, қазақ популяциясы жеке тұлғаларының толық геномдарының хромосомалық жинағын жасау болып табылады.

биоинформатические метода анализа данных:flye, medaka, HyPo, quast, busco, bionano solve, bionano access и другие.

Деректерді талдаудың биоинформатикалық әдістері:flye, medaka, HyPo, quast, busco, bionano solve, bionano access және басқалары.

Реализована задача по интеграции данных коротких сиквенсовых прочтений с целью полировки и улучшения ранее полученных сборок полных геномов. На данном этапе были использованы короткие прочтения, полученные на платформах DNBSEQ и ONT. Многоступенчатая стратегия позволила значительно снизить количество ошибок в сборках, в частности, число инсерций и делеций. Показатели сборки полных геномов после интеграции данных коротких сиквенсовых прочтений для различных образцов составили: 2,873,151,071 нуклеотидов в составе 1481 контигов; 2,858,532,797 нуклеотидов в составе 1606 контигов; 2,861,396,956 нуклеотидов в составе 1471 контигов. Проведена интеграция данных длинных прочтений и оптических карт, полученных с платформы Bionano. После предварительной фильтрации и сборки оптических карт в программных пакетах Bionano Access/Solve была выполнена стадия гибридного скаффолдинга. Для интеграции использовались предварительно собранные континги, полученные на основе длинных прочтений платформ ONT. Оптические карты позволили уточнить порядок и ориентацию контигов, устранить химерные участки, а также объединить соседние фрагменты. По итогам интеграции наблюдалось увеличение метрики scaffold N50, что свидетельствует о повышении непрерывности геномной последовательности. Проведенный анализ полноты сборки с использованием BUSCO показал увеличение доли полноценных ортологов, что подтверждает улучшение структурного и функционального качества итогового генома

Толық геномдардың бұрын алынған құрылымдарын жылтырату және жақсарту мақсатында қысқа мерзімді оқылымдардың деректерін біріктіру міндеті іске асырылды. Осы кезеңде DNBSEQ және ONT платформаларында алынған қысқа оқулар қолданылды. Көп сатылы стратегия құрастыру қателерінің санын, атап айтқанда, инсерция мен жою санын айтарлықтай азайтуға мүмкіндік берді. Әртүрлі үлгілер үшін қысқа мерзімді оқылым деректерін біріктіргеннен кейін толық геномдарды құрастыру көрсеткіштері: 1481 контиг құрамындағы 2,873,151,071 нуклеотид; 1606 контиг құрамындағы 2,858,532,797 нуклеотид болды; Құрамында 1471 контиг бар 2,861,396,956 нуклеотид. Bionano платформасынан алынған ұзақ оқу деректері мен оптикалық карталардың интеграциясы жүргізілді. Bionano Access/Solve бағдарламалық пакеттерінде оптикалық карталарды алдын ала сүзіп, құрастырғаннан кейін гибридті скаффолдинг кезеңі орындалды. Интеграция үшін ONT платформаларын ұзақ оқудан алынған алдын-ала жиналған контингтер қолданылды. Оптикалық карталар контигтердің реті мен бағытын нақтылауға, Химера учаскелерін жоюға, сондай-ақ көрші фрагменттерді біріктіруге мүмкіндік берді. Интеграция нәтижелері бойынша scaffold N50 метрикасының жоғарылауы байқалды, бұл геномдық реттіліктің үздіксіздігінің жоғарылауын көрсетеді. BUSCO көмегімен құрастырудың толықтығын талдау толық ортологтардың үлесінің артқанын көрсетті, бұл қорытынды геномның құрылымдық және функционалдық сапасының жақсарғанын растайды

Впервые проведена гибридная интеграция данных длинных прочтений и оптических карт, полученных с платформы Bionano Saphyr.

Алғаш рет Bionano saphyr платформасынан алынған ұзақ оқылым деректері мен оптикалық карталардың гибридті интеграциясы жүргізілді.

қарастырылмаған

не предусмотрено

Гибридная сборка генома индивидуума казахской популяции может применяться в фундаментальных и биомедицинских исследованиях

Қазақ популяциясының жеке тұлғасының геномын гибридті құрастыру іргелі және биомедициналық зерттеулерде қолданылуы мүмкін

геномика, биоинформатика, биомедицина

геномика, биоинформатика, биомедицина

UDC indices
575.1
International classifier codes
34.23.02; 34.23.35; 34.03.23;
Key words in Russian
геномика; полный геном; биоинформатика; популяционная генетика; секвенирование;
Key words in Kazakh
геномика; толық геном; биоинформатика; популяция генетикасы; секвенирлеу;
Head of the organization Сарбасов Дос Джурмаханбет Доктор философии (Ph.D), Биохимия и Молекулярная Биология / профессор
Head of work Каиров Улыкбек Еруланович Ph.D / +