Information card

You have disabled JavaScript ... To complete the work, you must enable JavaScript in your browser

Inventory number	IRN	Number of state registration
0225РК01001	AP19676581-OT-25	0123РК00506
Document type	Terms of distribution	Availability of implementation
Заключительный	Gratis	Number of implementation: 0 Not implemented
Publications
Native publications: 0
International publications: 3	Publications Web of science: 3	Publications Scopus: 3
Number of books	Appendicies	Sources
0	3	46
Total number of pages	Patents	Illustrations
166	0	18
Amount of funding	Code of the program	Table
35534351	AP19676581	8
Name of work
In-silico поиск лекарств с возможностью генерации молекул, прогнозирования сродства лекарств с мишенью и валидации лекарственно-подобных молекул с помощью машинного обучения
Report title

Type of work	Source of funding	The product offerred for implementation
Fundamental		Технология
Report authors
ДР ФАЗЛЫ СИАМАК
Engineers from production 0 Undergraduates 0 Doctoral students 3 Foreign scientists 0
Customer		МНВО РК
Information on the executing organization
Short name of the ministry (establishment)		Нет
Full name of the service recipient
Nazarbayev University
Abbreviated name of the service recipient		NU
Abstract
The object of research, development or design (in Russian) : Исследование и разработка методов машинного обучения и хемоинформатики для поиска и улучшения лекарств (DTA) включают создание новой модели прогнозирования взаимодействия лекарств с мишенью, разработку комплексных инструментов DTA, а также создание биологического бенчмарк-тестировщика для молекулярных генеративных моделей и хемоинформатики, которые помогут в поиске новых лекарств. Инструментарий также включает в себя предсказывание токсичности возможных лекарств с помощью многозадачного обучения и анализ токсичности генеративных моделей The object of research, development or design (in Kazakh) : Дәрі-дәрмектерді іздеу және жақсарту (DTA) үшін машиналық оқыту және химоинформатика әдістерін зерттеу және әзірлеу дәрі-дәрмектердің мақсатты өзара әрекеттесуін болжаудың жаңа моделін құруды, DTA кешенді құралдарын әзірлеуді және жаңа дәрі-дәрмектерді табуға көмектесетін молекулалық генеративті модельдер мен химоинформатика үшін биологиялық эталондық тестер құруды қамтиды. Құралдар жинағы сонымен қатар көп тапсырмалы оқыту арқылы ықтимал дәрілердің уыттылығын болжауды және генеративті үлгілердің уыттылығын талдауды қамтиды Aim of work (in Russian) : Несмотря на то, что машинное обучение уже начало трансформировать ранние стадии процесса открытия лекарств, необходимо решить ряд важных открытых вопросов, чтобы усилить полезность и влияние этой прикладной междисциплинарной области исследований. Цель данного проекта - рассмотреть и решить эти вопросы путем разработки необходимых инструментов машинного обучения и биологической проверки их результатов. Данный инструментарий включает в себя базу данных связывания лекарств с целевыми группами белков, создания модели предсказывания данного связывания, а также исследование токсичности соединений с помощью многозадачного подхода и анализ генеративных моделей Aim of work (in Kazakh) : Машиналық оқыту дәрі-дәрмектерді табу процесінің алғашқы кезеңдерін өзгерте бастағанына қарамастан, осы қолданбалы пәнаралық зерттеу саласының пайдалылығы мен әсерін күшейту үшін бірқатар маңызды ашық мәселелерді шешу қажет. Бұл жобаның мақсаты-машиналық оқытудың қажетті құралдарын әзірлеу және олардың нәтижелерін биологиялық тексеру арқылы осы мәселелерді қарастыру және шешу. Бұл құрал дәрі-дәрмектерді ақуыздардың мақсатты топтарымен байланыстыратын мәліметтер базасын, осы байланыстыруды болжау моделін құруды, сондай-ақ көп тапсырмалы тәсілді қолдана отырып қосылыстардың уыттылығын зерттеуді және генеративті модельдерді талдауды қамтиды Методы исследования (на русском) : Использование позиционного встраивания для малых молекул; Использование функций потерь с возможностью заполнения недостающих значений и использование остаточных связей; Генерирование прогнозов для известных лекарств с целью их перепрофилирования на различные мишени; Метрика восстановления; Mетрика DTA; Предсказание DTA и токсичности на основе ML, Молекулярный докинг. Методы исследования (на казахском) : Шағын молекулалар үшін позициялық ендіруді пайдалану; жетіспейтін мәндерді толтыру мүмкіндігімен жоғалту функцияларын пайдалану және қалдық байланыстарды пайдалану; әртүрлі мақсаттарға қайта бағыттау мақсатында белгілі препараттар үшін болжамдар жасау; қалпына келтіру көрсеткіші; DTA көрсеткіші; ML негізіндегі DTA және уыттылықты болжау, молекулалық қондыру. Obtained results and novelty (in Russian) : В рамках проекта были созданы два взаимодополняющих многозадачных предиктора (MLT-LE и CheMLT-F), система оценки ABRAHAM для оценки генеративных моделей по отношению к биологическим мишеням, а также DTA Atlas — крупная база данных по перепрофилированию с предсказанными показателями сродства для всего протеома. Был создан набор инструментов для хемоинформатики, позволяющий осуществлять комплексные рабочие процессы, включая возможность оценки потенциальных кандидатов в лекарственные препараты по их DTA-оценкам, а также проверку токсичности и физических свойств с последующей сортировкой/исследованием. Ключевые методологические вклады включают в себя многозадачную обучающую методику с учетом отсутствующих меток, слияние трансформеров для прогнозирования нескольких конечных показателей по более чем 680 возможным меткам (включая токсичность, аффинность связывания и физические свойства) и трехмодальный критерий оценки, сочетающий в себе воссоздание, прогнозируемую аффинность и докинг. Obtained results and novelty (in Kazakh) : Жоба екі қосымша көп тапсырмалы болжаушыларды (MLT-le және CheMLT-F), биологиялық нысандарға қатысты генеративті модельдерді бағалауға арналған ABRAHAM бағалау жүйесін, сондай — ақ DTA Atlas-бүкіл протеом үшін болжамды жақындық көрсеткіштері бар үлкен қайта құру дерекқорын жасады. Химоинформатикаға арналған құралдар жинағы құрылды, ол кешенді жұмыс процестерін, соның ішінде ықтимал дәрілік үміткерлерді DTA бағалауы бойынша бағалау мүмкіндігін, сондай-ақ уыттылық пен физикалық қасиеттерді тексеруді, содан кейін сұрыптауды/зерттеуді жүзеге асыруға мүмкіндік береді. Негізгі әдіснамалық үлестерге жетіспейтін белгілерді ескере отырып, көп тапсырмалы оқыту әдістемесі, 680-ден астам ықтимал белгілер бойынша бірнеше соңғы көрсеткіштерді болжау үшін трансформаторлардың бірігуі (уыттылық, байланыстыру жақындығы және физикалық қасиеттерді қоса алғанда) және рекреацияны, болжамды жақындықты және докингті біріктіретін үш модальды бағалау критерийі кіреді. The main constructive and technical economic indicators (in Russian) : В ходе работы над этим проектом было подготовлено к публикации в общей сложности 6 научных работ, 5 из которых были опубликованы в зарубежных научных журналах, индексируемых в Science Citation Index Expanded и включенных в первый квартиль (Q1) по импакт-фактору в базе данных Web of Science и/или имеющих процентиль CiteScore в базе данных Scopus не менее 80 (восьмидесяти). Кроме того, 2 из этих журналов имеют процентиль CiteScore выше 95. Шестая публикация под названием «CheMLT-F: Multitask Learning in Biochemistry through Transformer Fusion» была представлена и в настоящее время проходит рецензирование в Journal of Cheminformatics, одном из высокорепутационных журналов по биоинформатике Q1 (BMC Springer), также с оценкой 95%. The main constructive and technical economic indicators (in Kazakh) : Осы жобамен жұмыс барысында барлығы 6 ғылыми жұмыс жариялауға дайындалды, оның 5-і Science Citation Index Expanded индекстелген және web of Science деректер базасында импакт-фактор бойынша бірінші квартильге (Q1) енгізілген және/немесе деректер базасында citescore процентилі бар шетелдік ғылыми журналдарда жарияланды Scopus кем дегенде 80 (сексен). Сонымен қатар, осы журналдардың 2-9 citescore процентилі 95-тен жоғары. "CheMLT-F: multitask learning in Biochemistry through Transformer Fusion" атты алтыншы басылым ұсынылды және қазіргі уақытта Q1 (BMC Springer) жоғары беделді Биоинформатика журналдарының бірі Cheminformatics журналында 95% рейтингімен қаралуда. Level of implementation (in Russian) : DTA датабаза реализована по адресу https://cheml.io/binding/ Инструментарий хемоинформатики загружен по адресу https://github.com/vmun/CheMLT-F Level of implementation (in Kazakh) : DTA деректер базасы мына жерде жүзеге асырылады https://cheml.io/binding/ Химоинформатика құралдары мына мекен-жайға жүктелген https://github.com/vmun/CheMLT-F Efficiency (in Russian) : Разрабатываемое программное обеспечение использует современные подходы машинного обучения, библиотеки Python, а также подвергается постоянной ревизии для ускорения и эффектиности работы. Вся работа равномерно распределена между участниками проекта для достижения эффективного исследования и разработки Efficiency (in Kazakh) : Әзірленіп жатқан бағдарламалық жасақтама машиналық оқытудың, Python кітапханасының заманауи тәсілдерін қолданады, сонымен қатар жұмысты жеделдету және тиімді ету үшін үнемі қайта қаралуда. Барлық жұмыс тиімді зерттеулер мен әзірлемелерге қол жеткізу үшін жобаға қатысушылар арасында біркелкі бөлінеді Field of application (in Russian) : Открытие новых лекарств используя молекулярную генерацию ML и перепрофилирование уже известных соединений на основе экспериментов in silico с использованием машинного обучения Field of application (in Kazakh) : ML молекулалық генерациясын қолдана отырып жаңа дәрі дәрмектерді табу және машиналық оқытуды қолдана отырып in silico эксперименттеріне негізделген бұрыннан белгілі қосылыстарды қайта құру
UDC indices
004.9
International classifier codes
20.00.00;
Readiness of the development for implementation
Key words in Russian
машинное обучение; химическая информатика; открытие лекарства; молекулярная генерация; бенчмаркинг; многозадачное обучение; предсказание сродства к лекарству-мишени;
Key words in Kazakh
машиналық оқыту; химиялық информатика; дәрілерді анықтау; молекулалық генерация; салыстыру; көп-тапсырмалы оқыту; дәрілік мақсатқа жақындығын болжау;
Head of the organization	РЕХАН САДИК	Academic degree/title: Phd / Professor
Head of work	ДР ФАЗЛЫ СИАМАК	Academic degree/title : Ph.D / Associate Professor
Native executive in charge		Academic degree/title:

Eng

Қаз

Рус