| Inventory number | IRN | Number of state registration |
|---|---|---|
| 0225РК00365 | AP19678041-OT-25 | 0123РК00260 |
| Document type | Terms of distribution | Availability of implementation |
| Заключительный | Gratis | Number of implementation: 0 Not implemented |
| Publications | ||
| Native publications: 5 | ||
| International publications: 6 | Publications Web of science: 2 | Publications Scopus: 6 |
| Number of books | Appendicies | Sources |
| 1 | 6 | 11 |
| Total number of pages | Patents | Illustrations |
| 68 | 0 | 6 |
| Amount of funding | Code of the program | Table |
| 35800000 | AP19678041 | 0 |
| Name of work | ||
| Разработка программного обеспечения для идентификации тандемных повторов при полногеномном секвенировании | ||
| Report title | ||
| Type of work | Source of funding | The product offerred for implementation |
| Applied | Другая (укажите) | |
| Report authors | ||
| Исмаилова Айсулу Абжаппаровна , Календарь Руслан Николаевич , Кадиркулов Куаныш Кайсарович , Голенко Екатерина Сергеевна , | ||
|
1
0
2
0
|
||
| Customer | МНВО РК | |
| Information on the executing organization | ||
| Short name of the ministry (establishment) | МСХ РК | |
| Full name of the service recipient | ||
| Некоммерческое акционерное общество Казахский агротехнический исследовательский университет имени Сакена Сейфуллина | ||
| Abbreviated name of the service recipient | НАО «КАТИУ им. С.Сейфуллина» | |
| Abstract | ||
|
Объектами исследования являлись полногеномные данные бактериальных штаммов, полученные с платформ секвенирования нового поколения (Illumina MiSeq). В исследование были включены как экспериментальные данные, полученные в лаборатории ТОО «Национальный центр биотехнологии», так и открытые геномные последовательности из базы данных NCBI GenBank, содержащие эталонные геномы и тестовые наборы для моделирования локусов с тандемными повторами. Зерттеу нысандары жаңа буын секвенирлеу платформаларынан (Illumina MiSeq) алынған бактериялық штаммдардың толық геномдық деректері болды. Зерттеуге "Ұлттық биотехнология орталығы" ЖШС зертханасында алынған эксперименттік деректер де, GenBank NCBI дерекқорынан алынған анықтамалық геномдар мен тандемді қайталау локустарын модельдеуге арналған сынақ жинақтары бар ашық геномдық тізбектер де енгізілді. Цель проекта: разработка биоинформационного приложения с открытым доступом для идентификации и анализа вариабельности тандемных повторов, в том числе, в исходных данных при полногеномном секвенировании третьего поколения. Жобаның мақсаты – үшінші буын толық геномды секвенирлеу нәтижелерінде тандемді қайталанулардың вариабелдігін анықтау және талдау үшін ашық қолжетімді биоинформатикалық қосымшаны әзірлеу. Методы исследования: были использованы методы молекулярно-генетического анализа и вычислительной биоинформатики, направленные на автоматизацию процесса поиска и классификации тандемных повторов в сырых полногеномных данных. Разработанное программное обеспечение включало несколько функциональных модулей, объединённых в единую вычислительную оболочку: модуль поиска тандемных повторов, модуль идентификации аллелей, интеграция с базами данных и SQL-анализ, модуль машинного обучения, модуль визуализации. Зерттеу әдістері: шикі геномдық деректерде тандемдік қайталануларды іздеу және жіктеу процесін автоматтандыруға бағытталған молекулалық-генетикалық талдау және есептеу биоинформатикасы әдістері қолданылды. Әзірленген бағдарламалық жасақтама бір есептеу қабығына біріктірілген бірнеше функционалды модульдерді қамтыды: тандемді қайталау іздеу модулі, аллельді сәйкестендіру модулі, мәліметтер базасымен интеграция және SQL талдау, Машиналық оқыту модулі, визуализация модулі. Научная новизна данного проекта заключается в создании и экспериментальной валидации интегрированной программной платформы, объединяющей методы статистического анализа, машинного обучения и алгоритмической биоинформатики для идентификации, классификации и анализа аллельных вариантов тандемных повторов в геномах различной сложности. Разработанные алгоритмы позволяют не только выявлять известные повторы, но и предсказывать новые участки с потенциально скрытой сигнатурой, определять степень гетерогенности тандемных блоков и выполнять автоматизированную классификацию повторов без предварительного выравнивания. В результате реализации проекта разработан законченный биоинформационный комплекс, включающий библиотеку классов для поиска, классификации и визуализации тандемных повторов, модуль идентификации аллельных вариантов и статистической оценки достоверности, а также программную среду для автоматизации вычислений. Бұл жобаның ғылыми жаңалығы Әртүрлі күрделіліктегі геномдардағы тандемдік қайталанулардың аллельді нұсқаларын анықтау, жіктеу және талдау үшін статистикалық талдау, Машиналық оқыту және алгоритмдік биоинформатика әдістерін біріктіретін интеграцияланған бағдарламалық платформаны құру және эксперименттік валидация болып табылады. Әзірленген Алгоритмдер белгілі қайталануларды анықтап қана қоймай, сонымен қатар ықтимал жасырын қолтаңбасы бар жаңа учаскелерді болжауға, тандемдік блоктардың гетерогенділік дәрежесін анықтауға және алдын ала туралаусыз қайталанулардың автоматтандырылған классификациясын орындауға мүмкіндік береді. Жобаны іске асыру нәтижесінде тандемдік қайталауларды іздеу, жіктеу және визуализациялау үшін сыныптар кітапханасын, аллельдік нұсқаларды сәйкестендіру модулін және сенімділікті статистикалық бағалауды, сондай-ақ есептеулерді автоматтандыруға арналған бағдарламалық ортаны қамтитын толық биоақпараттық кешен әзірленді. Архитектура. Система реализована на сервисно-ориентированной архитектуре (SOA) с поддержкой модульного веб-интерфейса. Совместимость. Программный комплекс поддерживает работу с основными форматами биоинформационных и текстовых данных, включая FASTQ, TXT, JSON и PDF, что обеспечивает универсальность при обмене данными и формировании отчетов. Интероперабельность. Реализована функция импорта пользовательских панелей и праймеров в форматах CSV, JSON и TXT, что позволяет пользователю адаптировать систему под собственные задачи анализа и аннотации данных. Развёртывание. Серверная часть развертывается на платформе Linux Ubuntu Server, в то время как клиентская часть предназначена для эксплуатации на Linux CentOS в среде веб-хостинга. Безопасность. Система использует многоуровневую модель защиты, включающую: • авторизацию посредством токенов доступа; • аутентификацию пользователей по ролевой модели; • регистрацию через электронную почту с обязательной активацией учетной записи администратором. Данные механизмы гарантируют контроль доступа и защиту персональных данных. Экономический эффект. Внедрение системы способствует сокращению времени перехода от получения данных к формированию отчетов («данные → отчёт»), а также снижает объем ручной аннотации. Это обеспечивает повышение эффективности работы специалистов и сокращение трудозатрат при анализе данных. Сәулет. Жүйе модульдік веб-интерфейсті қолдайтын қызметке бағытталған архитектурада (SOA) жүзеге асырылады. Үйлесімділік. Бағдарламалық жасақтама биоақпараттық және мәтіндік деректердің негізгі форматтарымен, соның ішінде FASTQ, TXT, JSON және PDF-пен жұмыс істеуді қолдайды, бұл деректермен алмасу және есеп беру кезінде әмбебаптықты қамтамасыз етеді. Интероперабельділік. Пайдаланушы панельдері мен праймерлерін CSV, JSON және TXT форматтарында импорттау мүмкіндігі іске асырылды, бұл пайдаланушыға жүйені деректерді талдау және аннотациялау тапсырмаларына бейімдеуге мүмкіндік береді. Орналастыру. Сервер бөлігі Linux Ubuntu Server платформасында орналастырылған, ал клиенттік бөлігі веб-хостинг ортасында Linux CentOS жүйесінде жұмыс істеуге арналған. Қауіпсіздік. Жүйе көп деңгейлі қорғаныс моделін қолданады, соның ішінде: * кіру таңбалауыштары арқылы авторизациялау; * рөлдік модель бойынша пайдаланушылардың аутентификациясы; * әкімші міндетті түрде есептік жазбаны белсендіре отырып, электрондық пошта арқылы тіркелу. Бұл механизмдер қол жетімділікті бақылауға және дербес деректерді қорғауға кепілдік береді. Экономикалық әсер. Жүйені енгізу деректерді алудан есептерді қалыптастыруға көшу уақытын қысқартуға ықпал етеді ("деректер → есеп"), сондай-ақ қолмен Аннотация көлемін азайтады. Бұл мамандардың жұмыс тиімділігін арттыруды және деректерді талдау кезінде еңбек шығындарын азайтуды қамтамасыз етеді. Разработанные алгоритмы, их экспериментальная проверка и программная реализация соответствуют уровню технологической готовности TRL 3, что подтверждается созданием экспериментального прототипа и его тестированием на реальных данных секвенирования. Әзірленген Алгоритмдер, оларды эксперименттік тексеру және бағдарламалық қамтамасыз ету TRL 3 технологиялық дайындық деңгейіне сәйкес келеді, бұл эксперименттік прототипті құру және оны нақты реттілік деректерінде сынау арқылы расталады. Эффективность выражается в создании биоинформационного программного комплекса для идентификации и анализа тандемных повторов, прошедшего экспериментальную валидацию (TRL-3) и доступного к практическому использованию. Полученные научные результаты подтверждены публикациями в ведущих международных журналах и могут быть применены в биоинформатике, геномике и молекулярной диагностике для анализа генетического разнообразия и разработки новых подходов к исследованию геномов человека и микроорганизмов. Тиімділік эксперименттік валидациядан өткен (TRL-3) және практикалық қолдануға қол жетімді тандемдік қайталануларды анықтау және талдау үшін биоақпараттық бағдарламалық жасақтама құруда көрінеді. Алынған ғылыми нәтижелер жетекші халықаралық журналдардағы жарияланымдармен расталады және генетикалық әртүрлілікті талдау және адам геномдары мен микроорганизмдерді зерттеудің жаңа тәсілдерін әзірлеу үшін биоинформатикада, геномикада және молекулалық диагностикада қолданылуы мүмкін. Биоинформатика, биология, физиология, биомедицина, биотехнология. Биоинформатика, биология, физиология, биомедицина, биотехнология. |
||
| UDC indices | ||
| 681.3:578.5(083.94) | ||
| International classifier codes | ||
| 20.53.19; | ||
| Readiness of the development for implementation | ||
| Key words in Russian | ||
| ТАНДЕМНЫЕ ПОВТОРЫ; ПОЛНОГЕНОМНОЕ СЕКВЕНИРОВАНИЕ; КЛАСТЕРИЗАЦИЯ; КЛАССИФИКАЦИЯ; БИОИНФОРМАЦИОННАЯ ПЛАТФОРМА; | ||
| Key words in Kazakh | ||
| ТАНДЕМДІ ҚАЙТАЛАНУЛАР; ТОЛЫҚ ГЕНОМДЫҚ СЕКВЕНИРЛЕУ; КЛАСТЕРЛЕУ; КЛАССИФИКАЦИЯ; БИОИНФОРМАТИКАЛЫҚ ПЛАТФОРМА; | ||
| Head of the organization | Тиреуов Канат Маратович | Доктор экономических наук / профессор |
| Head of work | Исмаилова Айсулу Абжаппаровна | Доктор PhD / ассоциированный профессор |
| Native executive in charge | Календарь Руслан Николаевич | Профессор |