Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0324РК00209 | AP19676581-KC-24 | 0123РК00506 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 0 | ||||
International publications: 1 | Publications Web of science: 1 | Publications Scopus: 1 | ||
Patents | Amount of funding | Code of the program | ||
0 | 35047673 | AP19676581 | ||
Name of work | ||||
In-silico поиск лекарств с возможностью генерации молекул, прогнозирования сродства лекарств с мишенью и валидации лекарственно-подобных молекул с помощью машинного обучения | ||||
Type of work | Source of funding | Report authors | ||
Fundamental | ДР ФАЗЛЫ СИАМАК | |||
0
2
3
0
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | Нет | |||
Full name of the service recipient | ||||
Nazarbayev University | ||||
Abbreviated name of the service recipient | NU | |||
Abstract | ||||
Исследование и разработка методов машинного обучения и хемоинформатики для поиска и улучшения лекарств (DTA) включают создание новой модели прогнозирования взаимодействия лекарств с мишенью, разработку комплексных инструментов DTA, а также создание биологического бенчмарк-тестировщика для молекулярных генеративных моделей и хемоинформатики, которые помогут в поиске новых лекарств. Инструментарий также включает в себя предсказывание токсичности возможных лекарств с помощью многозадачного обучения и анализ токсичности генеративных моделей Дәрі-дәрмектерді іздеу және жақсарту (DTA) үшін машиналық оқыту және химоинформатика әдістерін зерттеу және әзірлеу дәрі-дәрмектердің мақсатты өзара әрекеттесуін болжаудың жаңа моделін құруды, DTA кешенді құралдарын әзірлеуді және жаңа дәрі-дәрмектерді табуға көмектесетін молекулалық генеративті модельдер мен химоинформатика үшін биологиялық эталондық тестер құруды қамтиды. Құралдар жинағы сонымен қатар көп тапсырмалы оқыту арқылы ықтимал дәрілердің уыттылығын болжауды және генеративті үлгілердің уыттылығын талдауды қамтиды Несмотря на то, что машинное обучение уже начало трансформировать ранние стадии процесса открытия лекарств, необходимо решить ряд важных открытых вопросов, чтобы усилить полезность и влияние этой прикладной междисциплинарной области исследований. Цель данного проекта - рассмотреть и решить эти вопросы путем разработки необходимых инструментов машинного обучения и биологической проверки их результатов. Данный инструментарий включает в себя базу данных связывания лекарств с целевыми группами белков, создания модели предсказывания данного связывания, а также исследование токсичности соединений с помощью многозадачного подхода и анализ генеративных моделей Машиналық оқыту дәрі-дәрмектерді табу процесінің алғашқы кезеңдерін өзгерте бастағанына қарамастан, осы қолданбалы пәнаралық зерттеу саласының пайдалылығы мен әсерін күшейту үшін бірқатар маңызды ашық мәселелерді шешу қажет. Бұл жобаның мақсаты-машиналық оқытудың қажетті құралдарын әзірлеу және олардың нәтижелерін биологиялық тексеру арқылы осы мәселелерді қарастыру және шешу. Бұл құрал дәрі-дәрмектерді ақуыздардың мақсатты топтарымен байланыстыратын мәліметтер базасын, осы байланыстыруды болжау моделін құруды, сондай-ақ көп тапсырмалы тәсілді қолдана отырып қосылыстардың уыттылығын зерттеуді және генеративті модельдерді талдауды қамтиды Использование позиционного встраивания для малых молекул; Использование функций потерь с возможностью заполнения недостающих значений и использование остаточных связей; Генерирование прогнозов для известных лекарств с целью их перепрофилирования на различные мишени; Метрика восстановления; Mетрика DTA; Предсказание DTA и токсичности на основе ML, Молекулярный докинг. Шағын молекулалар үшін позициялық ендіруді пайдалану; жетіспейтін мәндерді толтыру мүмкіндігімен жоғалту функцияларын пайдалану және қалдық байланыстарды пайдалану; әртүрлі мақсаттарға қайта бағыттау мақсатында белгілі препараттар үшін болжамдар жасау; қалпына келтіру көрсеткіші; DTA көрсеткіші; ML негізіндегі DTA және уыттылықты болжау, молекулалық қондыру. В этой работе мы представляем открытую базу данных предсказанных взаимодействий лекарств с целевыми структурами (белками), названную DTA Atlas, которая охватывает весь протеом человека, а также широкий спектр продаваемых лекарств, что позволяет получить более 220 миллионов пар лекарство-цель. Также, мы предоставляем 2 собственных модели предсказывания связывания DTA основанных на многозадачном обучении - MLTLE и MLTBerta. MLTBerta также имеет возможность предсказывания токсичности лекарстсвенных соединений. Также мы предоставляем новую метрику оценки генаративных моделей ABRAHAM, импользующую композитный подход включающий в себя метрики воссоздания молекул, прогнозирования сродства и молекулярного докинга. Метрика также использует важное правило пяти Липински. Кроме этого, были проведены исследования для своевременного прогнозирования ИБС, ведь наличие новых лекарств не гарантирует их своевременное назначение Бұл жұмыста біз DTA Atlas деп аталатын мақсатты құрылымдармен (ақуыздармен) болжамды дәрілік өзара әрекеттесулердің ашық дерекқорын ұсынамыз, ол бүкіл адам протеомын, сондай-ақ сатылатын дәрілердің кең ауқымын қамтиды, бұл 220 миллионнан астам дәрі-дәрмек-мақсат жұптарын алуға мүмкіндік береді. Сондай - ақ, біз mltle және MLTBerta көп тапсырмалы оқытуға негізделген DTA байланыстыруды болжаудың 2 моделін ұсынамыз. MLTBerta-да дәрілік қосылыстардың уыттылығын болжау мүмкіндігі бар. Сондай-ақ, біз Abraham генеративті модельдерін бағалаудың жаңа метрикасын ұсынамыз композиттік тәсіл молекулаларды қайта құру, жақындықты болжау және молекулалық қондыру көрсеткіштерін қамтиды. Метрика сонымен қатар бес Липинскийдің маңызды ережесін қолданады. Сонымен қатар, АЖЖ-ны уақтылы болжау үшін зерттеулер жүргізілді, өйткені жаңа дәрі-дәрмектердің болуы олардың уақтылы тағайындалуына кепілдік бермейді Имеется 1 принятая публикации в Q1/Q2 индексируемом иностранном журнале Artificial Intelligence in the Life Sciences. Публикация доступна по адресу https://www.sciencedirect.com/science/article/pii/S2667318524000229?ref=pdf_download&fr=RR-2&rr=8d8851089ab41411. Также, при поддержке гранта была реализована дополнительная публикация в Scientific Data https://www.nature.com/articles/s41597-023-02871-z . Добавить ее в форму кратких сведений не получилось так как первый автор отсутствует в базе данных NCSTE и она является дополнительным результатом изучения машинного обучения для медицины и лекарств. В 2025 запланирована как минимум еще одна публикация по результатам прeдсказания токсичности генеративных моделей, а также ожидается публикация-анализ МLTBerta и ABRAHAM Q1/Q2 индекстелетін шетелдік Artificial Intelligence in the Life Sciences журналында 1 қабылданған жарияланым бар. Жарияланым мына жерде қол жетімді https://www.sciencedirect.com/science/article/pii/S2667318524000229?ref=pdf_download&fr=RR-2&rr=8d8851089ab41411. сондай-ақ, гранттың қолдауымен Scientific Data - да қосымша жарияланым іске асырылды https://www.nature.com/articles/s41597-023-02871-z . Оны қысқаша ақпарат формасына қосу нәтиже бермеді, өйткені бірінші автор NCSTU дерекқорында жоқ және бұл медицина мен дәрі-дәрмектерге арналған машиналық оқытуды үйренудің қосымша нәтижесі. 2025-те генеративті модельдердің уыттылығын болжау нәтижелері бойынша кем дегенде тағы бір жарияланым жоспарланған, сонымен қатар жарияланым күтілуде-Mltberta және ABRAHAM талдауы DTA датабаза реализована по адресу https://cheml.io/binding/ DTA деректер базасы мына жерде жүзеге асырылады https://cheml.io/binding/ Разрабатываемое программное обеспечение использует современные подходы машинного обучения, библиотеки Python, а также подвергается постоянной ревизии для ускорения и эффектиности работы. Вся работа равномерно распределена между участниками проекта для достижения эффективного исследования и разработки Әзірленіп жатқан бағдарламалық жасақтама машиналық оқытудың, Python кітапханасының заманауи тәсілдерін қолданады, сонымен қатар жұмысты жеделдету және тиімді ету үшін үнемі қайта қаралуда. Барлық жұмыс тиімді зерттеулер мен әзірлемелерге қол жеткізу үшін жобаға қатысушылар арасында біркелкі бөлінеді Открытие новых лекарств используя молекулярную генерацию ML и перепрофилирование уже известных соединений на основе экспериментов in silico с использованием машинного обучения ML молекулалық генерациясын қолдана отырып жаңа дәрі дәрмектерді табу және машиналық оқытуды қолдана отырып in silico эксперименттеріне негізделген бұрыннан белгілі қосылыстарды қайта құру |
||||
UDC indices | ||||
004.9 | ||||
International classifier codes | ||||
20.00.00; | ||||
Key words in Russian | ||||
машинное обучение; химическая информатика; открытие лекарства; молекулярная генерация; бенчмаркинг; многозадачное обучение; предсказание сродства к лекарству-мишени; | ||||
Key words in Kazakh | ||||
машиналық оқыту; химиялық информатика; дәрілерді анықтау; молекулалық генерация; салыстыру; көп-тапсырмалы оқыту; дәрілік мақсатқа жақындығын болжау; | ||||
Head of the organization | АДЕСИДА ИЛЕСАНМИ | Phd / Professor | ||
Head of work | ДР ФАЗЛЫ СИАМАК | Ph.D / Associate Professor |