Inventory number IRN Number of state registration
0325РК01175 AP22686389-KC-25 0124РК00218
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 1 Publications Web of science: 0 Publications Scopus: 1
Patents Amount of funding Code of the program
0 9994560 AP22686389
Name of work
Разработка и реализация метода координации движения интеллектуальных автономных мобильных роботов
Type of work Source of funding Report authors
Applied Қызырқанов Абзал Ермекбайұлы
0
0
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) Нет
Full name of the service recipient
"Astana IT University"
Abbreviated name of the service recipient "Astana IT University"
Abstract

Объект исследования – система координационного управления группой мобильных роботов с дифференциальным приводом, функционирующих в многоагентной среде и выполняющих задачи распределения целей, планирования движения и безопасного обхода препятствий с применением методов многоагентного обучения с подкреплением.

Зерттеу объектісі – көп агентті күшейтілген оқыту (MARL) әдістерін пайдаланып, дифференциалдық жетекке негізделген мобильді роботтардың көпагентті ортада мақсаттарды тиімді бөлуі, қозғалысты жоспарлауы және кедергілерден қауіпсіз айналып өтуін қамтамасыз ететін координациялық басқару жүйесі.

Цель работы – разработка и исследование методов координационного управления группой мобильных роботов с дифференциальным приводом в многоагентной среде на основе алгоритмов многоагентного обучения с подкреплением, обеспечивающих эффективное распределение целей, безопасное планирование движения и повышение устойчивости процессов обучения.

Жұмыстың мақсаты – көп агентті күшейтілген оқыту әдістерін пайдаланып, дифференциалды жетекке негізделген мобильді роботтардың мақсаттарды тиімді бөлуін, қозғалысты қауіпсіз жоспарлауын және көпагентті ортада тұрақты координациясын қамтамасыз ететін басқару алгоритмдерін әзірлеу және олардың жұмыс тиімділігін арттыру.

Методы исследования – анализ и моделирование алгоритмов многоагентного обучения с подкреплением (MARL); применение акторно-критических архитектур в рамках принципов централизованного обучения и децентрализованного исполнения (CTDE); математическое моделирование динамики движения мобильных роботов с дифференциальным приводом; использование венгерского алгоритма для динамического распределения целей; разработка и экспериментальная оценка стратегий повторного проигрывания опыта (tagged replay и offline replay); имитационное моделирование многоагентной среды и проведение вычислительных экспериментов для оценки эффективности и устойчивости разработанных алгоритмов.

Зерттеу әдістері – көп агентті күшейтілген оқыту (MARL) алгоритмдерін талдау және модельдеу; орталықтандырылған оқыту және децентрализдендірілген орындау (CTDE) қағидаттарына негізделген актор–критик архитектураларын қолдану; дифференциалды жетекті роботтардың қозғалыс динамикасын математикалық модельдеу; венгерлік алгоритм арқылы мақсаттарды динамикалық тағайындау; тәжірибені қайта пайдалану стратегияларын (tagged replay және offline replay) эксперименттік бағалау; көпагентті ортаны имитациялық модельдеу және есептеу эксперименттері арқылы жүйенің тиімділігін тексеру.

Полученные результаты: Разработана MARL-архитектура управления группой дифференциальных мобильных роботов. Реализована CTDE-модель с единым акторно-критическим подходом, обеспечившая стабильное обучение. Венгерский алгоритм встроен в цикл MARL для динамического назначения целей. Предложены стратегии tagged replay и offline replay, повышающие устойчивость и скорость сходимости. Эксперименты показали снижение столкновений, улучшение траекторий и рост покрытия целей. Научная новизна: Впервые для задач координации роботов предложен tagged replay для приоритетного обучения на редких критичных состояниях. Развит метод offline replay initialization для ускорения ранних этапов обучения. Венгерский алгоритм интегрирован как онлайн-механизм распределения целей. Создана новая CTDE-архитектура с улучшенными replay-механизмами, обеспечивающая устойчивое обучение в сложной многоагентной среде.

Алынған нәтижелер: Дифференциалды мобильді роботтар тобын басқаруға арналған MARL-архитектурасы әзірленді. Тұрақты оқытуды қамтамасыз еткен бірыңғай актор-критиктік тәсілі бар CTDE-моделі іске асырылды. Мақсаттарды динамикалық тағайындау үшін венгр алгоритмі MARL цикліне енгізілді. Тұрақтылықты және жинақталу жылдамдығын арттыратын tagged replay және offline replay стратегиялары ұсынылды. Эксперименттер соқтығыстардың азайғанын, траекториялардың жақсарғанын және мақсаттарды қамту деңгейінің артқанын көрсетті. Ғылыми жаңалық: Алғаш рет роботтарды координациялау міндеттері үшін сирек кездесетін сыни күйлерде басымдық беріп оқытуға арналған tagged replay ұсынылды. Оқытудың бастапқы кезеңдерін жеделдету үшін offline replay initialization әдісі дамытылды. Мақсаттарды бөлу үшін венгр алгоритмі онлайн-механизм ретінде интеграцияланды. Күрделі көпагентті ортада тұрақты оқытуды қамтамасыз ететін, жақсартылған replay-механизмдері бар жаңа CTDE-архитектурасы жасалды.

Конструктивные показатели: Система состоит из 6 мобильных роботов с дифференциальным приводом. Каждый робот имеет независимые приводы колёс, ограниченные по скорости и ускорению. Среда моделирования — поле 20×20 м с 10 препятствиями и 6 целями. Роботы используют эгоцентрические сенсорные данные для навигации. Технические показатели: Управление реализовано на основе MARL с архитектурой CTDE и единым акторно-критическим моделью. Цели распределяются динамически с использованием венгерского алгоритма на каждом шаге. Движение задаётся через дифференциальные скорости (ΔvL/ΔvR). Контролируются столкновения робот–робот и робот–препятствие. Технико-экономические показатели: Покрытие целей увеличено на 15–25%, число столкновений снижено на 40–60%. Применение улучшенных replay-стратегий ускорило обучение на 20–30%. Оптимизация траекторий уменьшает энергопотребление. Архитектура сохраняет эффективность при масштабировании до 6–12 роботов.

Конструктивтік көрсеткіштер: Жүйе 6 дифференциалды жетекке негізделген мобильді роботтан тұрады. Әр роботта тәуелсіз сол/оң жетек, шекті жылдамдық және үдеу параметрлері бар. Орта 20×20 м алаңнан, 10 кедергіден және 6 мақсаттан тұрады. Роботтар эгоцентрлік сенсорлық ақпаратпен жұмыс істейді. Техникалық көрсеткіштер: Басқару MARL негізіндегі CTDE актор–критик моделіне сүйенеді. Мақсаттар венгерлік алгоритм арқылы әр қадам сайын динамикалық тағайындалады. Қозғалыс ΔvL/ΔvR дифференциалды жылдамдықтарымен басқарылады. Қақтығыстар агент–агент және агент–кедергі деңгейінде бақыланады. Технико-экономикалық көрсеткіштер: Қамту деңгейі 15–25% жақсарды, соқтығысулар 40–60% азайды. Replay-стратегиялар оқыту тұрақтылығын арттырып, уақытты 20–30% қысқартты. Траекторияларды оңтайландыру энергия шығынын төмендетеді. Жүйе 6–12 агентке дейін тиімді масштабталады.

Внедрение результатов по данному проекту календарным планом не предусмотрено и в отчетном периоде не осуществлялось.

Осы жоба бойынша нәтижелерді енгізу күнтізбелік жоспарға сәйкес көзделмеген және есепті кезеңде жүзеге асырылмаған.

Разработанные методы и алгоритмы многоагентного управления мобильными роботами могут быть использованы в следующих областях: – Промышленная робототехника: складская логистика, автоматизированное перемещение грузов, управление группами сервисных и транспортных роботов. – Строительство и инфраструктурные проекты: картографирование больших территорий, мониторинг объектов, автономная доставка материалов. – Сельское хозяйство: мониторинг посевов, автоматизированный сбор урожая, многороботные системы обработки и опрыскивания. – Системы безопасности и спасательные операции: разведка опасных зон, поиск и спасение, выполнение задач в условиях, представляющих угрозу для человека. – Наука и образование: исследование координации в многоагентных системах, изучение MARL-алгоритмов, разработка экспериментальных робототехнических платформ. – Умный город и транспортные системы: автономные мобильные платформы, управление потоками, оптимизация логистики и навигации.

Ұсынылған көп агентті басқару әдістері мен алгоритмдері келесі салаларда қолданылуы мүмкін: – Өнеркәсіптік робототехника: қойма логистикасы, тауарларды жинау және сұрыптау, көп роботты көліктік жүйелерді басқару. – Құрылыс және инфрақұрылымдық қызметтер: үлкен аумақтарды картографиялау, объектілерді тексеру, материалдарды автономды жеткізу. – Ауыл шаруашылығы: егістіктерді бақылау, өнім жинау, көп роботты мониторинг және бүрку жүйелері. – Қауіпсіздік және құтқару жұмыстары: апат аймақтарын барлау, қауіпті аумақтарға автономды кіру, адам өміріне қауіпті жағдайларда роботтарды қолдану. – Білім беру және ғылыми зерттеулер: роботтық жүйелердің координациясын, көп агентті оқытуды және жасанды интеллект алгоритмдерін зерттеу. – Ақылды қала және көлік жүйелері: автономды мобильді платформаларды басқару, көліктік қозғалысты оңтайландыру, көп агентті навигация.

UDC indices
004.8
International classifier codes
28.23.27; 50.43.00;
Key words in Russian
мультиагентные системы; роевый интеллект; координация движении; роевая робототехника; мобильные роботы; Искусственный интеллект,; Автономные роботы;
Key words in Kazakh
көп агентті робот жүйелері; тобырлық интеллект; қозғалысты үйлестіру; тобырлық робототехника; мобильді роботтар; жасанды интеллект; Автономды роботтар;
Head of the organization Ахметов Альтаир Амангельдиевич /
Head of work Қызырқанов Абзал Ермекбайұлы Phd / assistant professor