Inventory number IRN Number of state registration
0225РК00842 AP19679015-OT-25 0123РК00720
Document type Terms of distribution Availability of implementation
Заключительный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 1 Publications Web of science: 1 Publications Scopus: 1
Number of books Appendicies Sources
1 3 76
Total number of pages Patents Illustrations
67 0 15
Amount of funding Code of the program Table
35800000 AP19679015 0
Name of work
Применение новых методов сбора и обработки данных, основанных на алгоритмах машинного обучения для анализа клеточной протеомы
Report title
Type of work Source of funding The product offerred for implementation
Fundamental Методическая документация
Report authors
Кулыясов Арман Табылович , Махсатова Сая Асхатовна , Құрманбай Аружан Бүркітбайқызы ,
1
1
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Товарищество с ограниченной ответственностью "Национальный центр биотехнологии"
Abbreviated name of the service recipient ТОО "Национальный центр биотехнологии"
Abstract

Объектами исследования являются рекомбинантные белки: TurboID-X, BAP-X и BirA-Y, где X, Y – GFP, EMD, NRM, POLH, RAD18, SOX2, OCT4 и NANOG.

Зерттеу нысандары – рекомбинантты ақуыздар: TurboID-X, BAP-X және BirA – Y, мұндағы X, Y-GFP, EMD, NRM, POLH, RAD18, SOX2, OCT4 және NANOG

Целью проекта является внедрение нового рабочего процесса, состоящего из комбинации независимого от данных накопления спектров (DIA) и их обработки с использованием программ, основанных на алгоритмах машинного обучения, для углубленного анализа распределения субклеточных белков, изучения их пост-трансляционных модификаций и межбелковых взаимодействий.

Жобаның мақсаты – жасушаішілік ақуыздардың таралуын терең талдау, олардың пост-трансляциялық модификацияларын және ақуызаралық өзара әрекеттесулерін зерттеу үшін машиналық оқыту алгоритмдеріне негізделген бағдарламаларды пайдалана отырып, деректерге тәуелсіз деректерді жинаудың (DIA) және деректерді өңдеудің комбинациясынан тұратын жаңа жұмыс процесін енгізу.

Методы исследования: молекулярные, биохимические, генетические методы анализа, режимы DDA и DIA для LC-MS/MS, биоинформатический анализ с использованием DIA-NN, PEAKS и Max-DIA.

Зерттеу әдістері: молекулалық, биохимиялық, генетикалық талдау әдістері, LC-MS/MS үшін DDA және DIA режимдері, DIA-NN, PEAKS, және Max-DIA көмегімен биоинформатикалық талдау.

Число идентификаций белков в клетках HEK293T и CHO увеличилось за счет применения более высоких частот MS и анализа в программе PEAKS; в образцах CHO идентифицировано до 1505 белков (рост до 28% при использовании Deep Learning Boost). Сочетание фракционирования по методу Масуда с DIA-LC-MS/MS обеспечило шестикратный рост числа идентификаций при градиенте 120 мин и колонке 50 см. По сравнению с литературными данными получены более детальные профили распределения белков и метаболических ферментов в субклеточных компартментах. Сконструированы 17 новых плазмид для экспрессии TurboID-X, BirA-UBA-X и BirA-UIM-X (X = GFP, EMD, NRM, SOX2, OCT4, NANOG, RAD18, POLH). В образцах BirA-UBA-X/UIM-X обнаружены взаимодействия с RAD18, SOX2, OCT4 и NANOG, включая PCNA, нуклеофосмин, SUMO3 и убиквитин. В образцах TurboID-X (X = GFP, SOX2 и NANOG) идентифицированы hnRNP ROA1, нуклеолин и гистоны.

HEK293T және CHO жасушаларында ақуыздарды идентификациялау саны MS жиіліктерін жоғарылату және PEAKS бағдарламасын пайдалану есебінен артты; CHO үлгілерінде 1505 ақуызға дейін анықталды (Deep Learning Boost қолданғанда өсім 28%-ға дейін). Масуда әдісі бойынша фракциялау DIA-LC-MS/MS-пен біріктірілгенде 120 минуттық градиент және 50 см колонка жағдайында идентификация санын алты есеге арттырды. Әдеби деректермен салыстырғанда субклеткалық компартменттерде ақуыздар мен метаболикалық ферменттердің таралуының анағұрлым толығырақ профильдері алынды. TurboID-X, BirA-UBA-X және BirA-UIM-X (X = GFP, EMD, NRM, SOX2, OCT4, NANOG, RAD18, POLH) экспрессиясына арналған 17 жаңа плазмида құрастырылды. BirA-UBA-X/UIM-X үлгілерінде RAD18, SOX2, OCT4 және NANOG-пен өзара әрекеттесетін компоненттер (PCNA, нуклеофосмин, SUMO3 және убиквитин) анықталды. TurboID-X (GFP, SOX2 және NANOG) үлгілерінде hnRNP ROA1, нуклеолин және гистондар сияқты көптеген ядролық ақуыздар идентификацияланды.

В 2025 году была опубликована одна статья в журналe входящих во второй (Q2) квартиль базы данных Web of Science.

2025 жылы Web of Science дерекқорының екінші (Q2) квартиліне кіретін журналда бір мақала жарияланды.

Не внедрено

Жүзеге асырылмады

Работы по календарному плану выполнены в полном объеме. Целевые индикаторы по публикациям будут достигнуты до конца текущего года.

Күнтізбелік жоспар бойынша жұмыстар толық көлемде орындалды. Жарияланымдар бойынша нысаналы индикаторларға ағымдағы жылдың соңына дейін қол жеткізіледі.

Внедрение новых методов сбора и обработки протеомных данных, основанных на машинном обучении, повысит способность лаборатории решать более сложные и разнообразные фундаментальные и практические аналитические задачи.

Машиналық оқытуға негізделген протеомдық деректерді жинау мен өңдеудің жаңа әдістерін енгізу зертхананың неғұрлым күрделі және алуан түрлі іргелі және практикалық аналитикалық тапсырмаларды шешу қабілетін арттырады.

UDC indices
577.217.5:577.218:577.29: 57.088.5:57.088.2:004.89
International classifier codes
34.15.17;
Readiness of the development for implementation
Key words in Russian
молекулярная и клеточная биология; протеомика; масс-спектрометрия; машинное и глубокое обучение; биотинилирование;
Key words in Kazakh
молекулалық және жасушалық биология; протеомика; масс-спектрометрия; машиналық және терең оқыту; биотинилдендіру;
Head of the organization Абеев Арман Бейсенбаевич к.б.н. / нет
Head of work Кулыясов Арман Табылович Кандидат химических наук / исследователь
Native executive in charge