| Inventory number | IRN | Number of state registration | ||
|---|---|---|---|---|
| 0325РК01753 | AP27510283-KC-25 | 0125РК00782 | ||
| Document type | Terms of distribution | Availability of implementation | ||
| Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
| Publications | ||||
| Native publications: 0 | ||||
| International publications: 1 | Publications Web of science: 1 | Publications Scopus: 1 | ||
| Patents | Amount of funding | Code of the program | ||
| 0 | 22682966 | AP27510283 | ||
| Name of work | ||||
| Исследование обучения многообразия и его приложений в обнаружении аномалий и обучении на размеченных данных | ||||
| Type of work | Source of funding | Report authors | ||
| Fundamental | Таханов Рустем | |||
|
0
0
1
0
|
||||
| Customer | МНВО РК | |||
| Information on the executing organization | ||||
| Short name of the ministry (establishment) | НУ | |||
| Full name of the service recipient | ||||
| Частное учреждение "Nazarbayev University Research Administration" | ||||
| Abbreviated name of the service recipient | ЧУ "Nazarbayev University Research Administration" | |||
| Abstract | ||||
|
Объектом исследования в проекте являются алгоритмы и модели машинного обучения, реализующие процесс построения низкоразмерных многообразий, описывающих структуру сложных данных. Особое внимание уделяется архитектурам автокодировщиков с ограничениями на ранг якобиана, а также их теоретическому анализу и вычислительной реализации. Изучается влияние геометрических свойств многообразий на эффективность обучения и способность моделей к обнаружению аномалий. Объект разработки включает новые методы оптимизации и регуляризации, повышающие устойчивость и интерпретируемость нейронных сетей. Жоба күрделі деректердің құрылымын сипаттайтын төмен өлшемді көпбейнелерді құратын машиналық оқыту алгоритмдері мен модельдеріне бағытталған. Якобиан рангілік шектеулері бар автокодерлердің архитектурасына, сондай-ақ олардың теориялық талдауы мен есептеуді жүзеге асыруына ерекше назар аударылады. Көпөлшемді геометриялық қасиеттердің оқыту тиімділігіне және модельдердің аномалияларды анықтау мүмкіндігіне әсері зерттелуде. Жобаның бағыты нейрондық желілердің беріктігі мен түсіндірілуін жақсартатын жаңа оңтайландыру және регуляризациялау әдістерін қамтиды. Цель работы — разработка эффективных и масштабируемых алгоритмов обучения многообразий и теоретического анализа их свойств для задач анализа данных, обнаружения аномалий и регуляризации моделей обучения. Проект основан на использовании новых архитектур автокодировщиков и методов оптимизации для повышения вычислительной эффективности. Көпөлшемді деректерді талдау мәселесін шешу үшін тиімді және масштабталатын көпбейне оқыту алгоритмдерін және осындай алгоритмдер үшін қатаң теориялық негіздерін әзірлеу. Жоба есептеу тиімділігін арттыру үшін жаңа автокодер архитектураларын және оңтайландыру әдістерін пайдалануға негізделген. Жоба есептеу тиімділігін арттыру үшін жаңа автокодер архитектуралары мен оңтайландыру әдістерін пайдалануға негізделген. Данный проект включает в себя как теоретические, так и экспериментальные исследования. Теоретический часть состоит из установления основополагающих предположений и строгую проверку (или опровержение) целевых утверждений посредством основных математических инструментов. Все теоретические выводы также тестируются в ходе экспериментальной фазы проекта, которая включает обучение и оценку алгоритмов машинного обучения. Бұл жоба теориялық және эксперименттік зерттеулерді қамтиды. Теориялық компонент негізгі болжамдарды белгілеуден және негізгі математикалық құралдарды пайдалана отырып, мақсатты тұжырымдарды қатаң тексеруден (немесе жоққа шығарудан) тұрады. Барлық теориялық қорытындылар жобаның эксперименттік кезеңінде де тексеріледі, бұл машиналық оқыту алгоритмдерін оқытуды және бағалауды қамтиды. Основные результаты за 2025 год 1.1. Публикация в журнале Neural Networks (Q1, Elsevier) Опубликована статья: Takhanov R. (2025). The informativeness of the gradient revisited. Neural Networks (Scopus percentile 92%, https://www.scopus.com/sourceid/24804). Работа посвящена фундаментальным вопросам информативности градиента в машинном обучении. 1.2. Статья On the Intrinsic Dimensions of Data in Kernel Learning (AISTATS 2026, на рецензии) Подготовлена и отправлена статья, напрямую посвящённая изучению внутренней размерности данных в контексте ядерного обучения. В работе введены понятия эффективной и внутренней размерности, описана их роль в оценках обобщающей способности и скорости сходимости в ядерной регрессии. Данная работа составляет теоретическую основу раздела проекта, связанного с обучением многообразий. 1.3. Статья Conditional KRR: Injecting Unpenalized Features into Kernel Methods with Applications to Kernel Thresholding (ICLR 2026, на рецензии) Рассматривается обобщение ядерной регрессии, позволяющее включать в модель некоторые нештрафуемые признаки (conditional features). 2025 жылға арналған негізгі нәтижелер 1.1. Нейрондық желілердегі жарияланым (1-тоқсан, Elsevier) Жарияланған: Таханов Р. (2025). "Градиенттің ақпараттықтығы қайта қарастырылды." Нейрондық желілер (Scopus перцентиль 92%, https://www.scopus.com/sourceid/24804). Бұл мақала машиналық оқытудағы градиент ақпараттықтықтың негізгі мәселелерін қарастырады. 1.2. "Ядролық оқытудағы деректердің ішкі өлшемдері туралы" мақаласы (AISTATS 2026, шолу күтілуде) Ядролық оқыту контексіндегі ішкі деректердің өлшемділігін зерттеуге тікелей арналған мақала дайындалып, ұсынылды. Мақалада тиімді және ішкі өлшемдер ұғымдары енгізіліп, ядро регрессиясындағы жалпылау қабілеті мен конвергенция жылдамдығын бағалаудағы олардың рөлі сипатталған. Бұл мақала жобаның көпбейне оқыту бөлімі үшін теориялық негіз болып табылады. 1.3. «Шартты KRR: ядро тәуелділігіне қолдану арқылы ядро әдістеріне жазаланбаған мүмкіндіктерді енгізу» мақаласы (ICLR 2026, шолу күтілуде) Бұл мақалада модельге белгілі бір жазаланбаған мүмкіндіктерді (шартты мүмкіндіктерді) қосуға мүмкіндік беретін ядро регрессиясының жалпылануы қарастырылады. Новая версия альтернирующего алгоритма, реализованная на TensorFlow 2 с использованием пакетного SVD, обеспечила ускорение вычислений в 3–4 раза при сохранении точности результатов. Оптимизация кода позволила значительно снизить ресурсоёмкость обучения и повысить эффективность использования вычислительных мощностей графических процессоров RTX 4090. Для обеспечения вычислительных ресурсов проекта закуплены три рабочие станции и три графических ускорителя NVIDIA RTX 4090, а также высокопроизводительный ноутбук MSI Raider 18 HX AI A2XWJG-887XKZ. Оборудование интегрировано в локальную вычислительную инфраструктуру и используется для обучения автокодировщиков. TensorFlow 2-де пакеттік SVD көмегімен енгізілген ауыспалы алгоритмнің жаңа нұсқасы нәтижелердің дәлдігін сақтай отырып, 3-4 есе үдеуге қол жеткізді. Кодты оңтайландыру оқу ресурстарын тұтынуды айтарлықтай азайтты және RTX 4090 GPU тиімділігін арттырды. Жобаның есептеу ресурстарын қамтамасыз ету үшін үш жұмыс станциясы және үш NVIDIA RTX 4090 графикалық үдеткіші, сондай-ақ жоғары өнімді MSI Raider 18 HX AI A2XWJG-887XKZ ноутбугы сатып алынды. Жабдық жергілікті есептеу инфрақұрылымына біріктірілген және автокодерлерді оқыту үшін қолданылады. Результаты проекта находятся на стадии научно-исследовательской и экспериментальной апробации. Разработанные алгоритмы обучения многообразий внедрены в вычислительные эксперименты и открыты для использования научным сообществом через GitHub-репозиторий. Жобаның нәтижелері қазіргі уақытта зерттеу және эксперименттік сынақ кезеңінде. Әзірленген көпбейне оқыту алгоритмдері есептеу эксперименттеріне енгізілді және GitHub репозиторийі арқылы ғылыми қауымдастыққа ашық. Алгоритмы, разработанные в рамках проекта, обеспечивают значительное снижение вычислительных затрат при построении многообразий по сравнению с традиционными методами. Использование ранговой регуляризации и архитектур автокодировщиков позволило повысить устойчивость моделей к переобучению и улучшить качество обобщения на сложных выборках. Результаты экспериментов подтверждают применимость разработанных решений к широкому классу задач анализа данных и обучения с учителем. Жоба аясында жасалған алгоритмдер дәстүрлі әдістермен салыстырғанда көпбейне құрылымның есептеу құнын айтарлықтай төмендетеді. Рангты регуляризациялауды және автокодер архитектураларын пайдалану модельдердің шамадан тыс сәйкестендіруге төзімділігін арттырды және күрделі үлгілерге жалпылауды жақсартты. Эксперименттік нәтижелер әзірленген шешімдердің деректерді талдау мен бақыланатын оқу мәселелерінің кең ауқымына қолданылуын растайды. Области применения данного исследования охватывают широкий спектр направлений, где требуется анализ сложных и высокоразмерных данных. В частности, результаты проекта могут быть использованы: 1. в финансовой аналитике — для обнаружения аномалий и предсказания экстремальных событий во временных рядах (например, на рынке NASDAQ); 2. в здравоохранении — для анализа медицинских данных и выявления редких патологических состояний; 3. в промышленности — для мониторинга технологических процессов и диагностики неисправностей оборудования; 4. в энергетике и транспорте — для анализа данных систем управления и предотвращения сбоев; 5. в интеллектуальных производственных технологиях — для оптимизации производственных процессов с помощью методов машинного обучения; 6. в информационных технологиях и системах искусственного интеллекта — для повышения эффективности и устойчивости обучаемых моделей; 7. в обработке больших данных и анализе сложных систем — для выявления скрытых закономерностей и структур в нелинейных динамиках; 8. в образовании и научных исследованиях — для развития национальной экспертизы в области машинного обучения и создания открытых программных инструментов (open-source). Бұл зерттеудің қолданылу салалары күрделі және жоғары өлшемді деректерді талдауды қажет ететін кең ауқымды салаларды қамтиды. Нақтырақ айтқанда, жобаның нәтижелерін мыналарда пайдалануға болады: 1. қаржылық аналитикада — уақыт қатарындағы ауытқуларды анықтау және экстремалды оқиғаларды болжау үшін (мысалы, NASDAQ нарығында); 2. денсаулық сақтауда — медициналық деректерді талдау және сирек кездесетін патологиялық жағдайларды анықтау үшін; 3. өнеркәсіпте — технологиялық процестерді бақылау және жабдықтардың ақауларын диагностикалау үшін; 4. энергетика және көлікте — басқару жүйесінің деректерін талдау және істен шығулардың алдын алу үшін; 5. интеллектуалды өндіріс технологияларында — машиналық оқыту әдістерін қолдана отырып, өндірістік процестерді оңтайландыру үшін; 6. ақпараттық технологиялар мен жасанды интеллект жүйелерінде — оқытылған модельдердің тиімділігі мен беріктігін арттыру үшін; 7. үлкен деректерді өңдеу және күрделі жүйелерді талдауда — сызықтық емес динамикада жасырын үлгілер мен құрылымдарды анықтау үшін; 8. білім беру және ғылыми зерттеулерде — машиналық оқыту саласындағы ұлттық сараптаманы дамыту және ашық бастапқы кодты бағдарламалық құралдарды жасау үшін. |
||||
| UDC indices | ||||
| 51.519.7 | ||||
| International classifier codes | ||||
| 27.47.23; | ||||
| Key words in Russian | ||||
| машинное обучение; глубокое обучение; регуляризация; обучение многообразий; автокодировщики; | ||||
| Key words in Kazakh | ||||
| машиналық оқыту; тереңдетілген оқыту; регуляризация; көпбейне оқыту; автокодировщиктар; | ||||
| Head of the organization | ДЖУМАБЕКОВ АСАНБАЙ КУДАЙБЕРГЕНОВИЧ | / нет | ||
| Head of work | Таханов Рустем | Candidate of Phys-Math Sciences / assistant professor | ||