| Inventory number | IRN | Number of state registration | ||
|---|---|---|---|---|
| 0325РК01434 | AP27511747-KC-25 | 0125РК00255 | ||
| Document type | Terms of distribution | Availability of implementation | ||
| Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
| Publications | ||||
| Native publications: 0 | ||||
| International publications: 0 | Publications Web of science: 0 | Publications Scopus: 0 | ||
| Patents | Amount of funding | Code of the program | ||
| 0 | 30000000 | AP27511747 | ||
| Name of work | ||||
| Разработка моделей глубокого обучения для автоматического обнаружения и предупреждения о потенциальных угрозах общественной безопасности на основе анализа звуковых данных | ||||
| Type of work | Source of funding | Report authors | ||
| Applied | Алтаева Айгерим Бакаткалиевна | |||
|
0
0
0
0
|
||||
| Customer | МНВО РК | |||
| Information on the executing organization | ||||
| Short name of the ministry (establishment) | Нет | |||
| Full name of the service recipient | ||||
| "Международный университет информационных технологий" | ||||
| Abbreviated name of the service recipient | МУИТ | |||
| Abstract | ||||
|
Объектами исследования проекта являются импульсивные звуковые сигналы, их цифровые представления, а также методы, алгоритмы и программные решения для их автоматического обнаружения, анализа и классификации с использованием технологий глубокого обучения. Жобаның зерттеу объектілері – импульстік дыбыстық сигналдар, олардың цифрлық бейнелері, сондай-ақ оларды автоматты түрде анықтау, талдау және классификациялау үшін қолданылатын терең оқыту технологияларына негізделген әдістер, алгоритмдер мен бағдарламалық шешімдер. Цель проекта заключается в разработке и валидации передовых моделей глубокого обучения, способных автоматически обнаруживать и предупреждать о потенциальных угрозах общественной безопасности на основе анализа звуковых данных, что позволит оперативно реагировать на экстренные ситуации, повышая тем самым общественную безопасность и эффективность работы экстренных служб Жобаның мақсаты – дыбыстық деректерді талдау негізінде қоғамдық қауіпсіздікке ықтимал қатерлерді автоматты түрде анықтап, ескерте алатын алдыңғы қатарлы терең оқыту модельдерін әзірлеу және валидациялау. Бұл төтенше жағдайларға жедел әрекет етуге мүмкіндік беріп, қоғамдық қауіпсіздікті арттыруға және төтенше жағдайлар қызметінің жұмыс тиімділігін жоғарылатуға ықпал етеді. В ходе реализации проекта были применены следующие методы: • Методы машинного обучения – использовались для построения базовых моделей классификации звуковых сигналов и выявления закономерностей в акустических данных. • Методы глубокого обучения – включающие использование сверточных (CNN), рекуррентных (RNN, LSTM) и гибридных нейронных сетей для анализа временных и спектральных признаков звуков. • Методы обработки звуковых сигналов – предусматривали извлечение и преобразование акустических признаков, таких как спектрограмма, мел-кепстральные коэффициенты (MFCC), хрома-фичи и энергия сигнала. • Методы аугментации данных – применялись для увеличения объема обучающего набора путем генерации модифицированных звуковых образцов (изменение частоты, скорости воспроизведения, амплитуды). • Методы статистического анализа – использовались для оценки достоверности результатов, анализа распределения классов и проверки корректности аннотаций. • Методы визуализации данных – применялись для анализа структуры признаков и интерпретации результатов классификации. • Методы тестирования и валидации – включали использование кросс-валидации, анализа ошибок, ROC-кривых и метрик (accuracy, precision, recall, F1-score) для подтверждения эффективности разработанных моделей. Жобаны іске асыру барысында келесі әдістер қолданылды: • Машиналық оқыту әдістері-дыбыстық сигналдарды жіктеудің негізгі модельдерін құру және акустикалық мәліметтердегі заңдылықтарды анықтау үшін қолданылды. • Терең оқыту әдістері-дыбыстардың уақытша және спектрлік белгілерін талдау үшін конволюциялық (CNN), қайталанатын (RNN, LSTM) және гибридті нейрондық желілерді қолдануды қамтиды. • Дыбыстық сигналдарды өңдеу әдістері – спектрограмма, бор-кепстральды коэффициенттер (MFCC), хром-фичи және сигнал энергиясы сияқты акустикалық белгілерді алу және түрлендіруді қамтамасыз етті. • Деректерді күшейту әдістері-модификацияланған дыбыстық үлгілерді (жиілікті, ойнату жылдамдығын, амплитудасын өзгерту) жасау арқылы оқу жиынтығының көлемін ұлғайту үшін қолданылды. • Статистикалық талдау әдістері-нәтижелердің дұрыстығын бағалау, сыныптардың таралуын талдау және аннотациялардың дұрыстығын тексеру үшін пайдаланылды. • Деректерді визуализациялау әдістері-белгілердің құрылымын талдау және жіктеу нәтижелерін түсіндіру үшін қолданылды. • Тестілеу және валидация әдістері-әзірленген модельдердің тиімділігін растау үшін кросс-валидацияны, қателерді талдауды, ROC қисықтары мен көрсеткіштерін (accuracy, precision, recall, F1-score) пайдалануды қамтиды. В ходе реализации проекта достигнуты существенные результаты, отражающие как научную, так и практическую значимость проведённых исследований. Сформирован специализированный датасет, включающий различные категории импульсивных звуков — крик, плач, сирену, взрыв, выстрел и звук разбитого стекла. Каждый аудиофайл снабжен аннотацией и метаинформацией, что обеспечивает возможность систематического обучения и валидации моделей глубокого обучения. Созданная база данных отвечает современным требованиям к качеству, структуре и воспроизводимости звуковых выборок, применяемых в задачах аудиоклассификации. Разработана и экспериментально протестирована гибридная архитектура модели, объединяющая сверточные и рекуррентные нейронные сети. Данное решение обеспечивает высокую точность и скорость классификации коротких звуковых событий, что позволяет применять модель в системах реального времени. Научная новизна проекта заключается в сочетании пространственно-временной обработки сигналов и механизмов выделения значимых акустических признаков, что ранее не применялось в комплексных задачах анализа импульсивных звуков. Практическая ценность работы выражается в создании интеллектуальной системы аудиомониторинга, способной автоматически выявлять потенциально опасные звуки и генерировать сигналы предупреждения, что повышает уровень безопасности и открывает перспективы для внедрения в системы «умного города» и объектов критической инфраструктуры. Жобаны іске асыру барысында жүргізілген зерттеулердің ғылыми және практикалық маңыздылығын көрсететін елеулі нәтижелерге қол жеткізілді. Импульсивті дыбыстардың әртүрлі санаттарын — айқайлау, жылау, сирена, жарылыс, ату және сынған әйнектің дыбысын қамтитын мамандандырылған датасет құрылды. Әрбір аудио файл аннотациямен және мета ақпаратпен қамтамасыз етілген, бұл терең оқыту үлгілерін жүйелі түрде оқыту және валидациялау мүмкіндігін қамтамасыз етеді. Құрылған мәліметтер базасы аудио классификация міндеттерінде қолданылатын дыбыстық үлгілердің сапасына, құрылымына және қайталануына қойылатын заманауи талаптарға жауап береді. Конволюциялық және қайталанатын нейрондық желілерді біріктіретін модельдің гибридті архитектурасы әзірленді және эксперименталды түрде сыналды. Бұл шешім қысқа дыбыстық оқиғаларды жіктеудің жоғары дәлдігі мен жылдамдығын қамтамасыз етеді, бұл модельді нақты уақыт жүйелерінде қолдануға мүмкіндік береді. Жобаның ғылыми жаңалығы сигналдарды кеңістіктік-уақыттық өңдеудің және импульсивті дыбыстарды талдаудың кешенді міндеттерінде бұрын қолданылмаған маңызды акустикалық белгілерді оқшаулау механизмдерінің үйлесімінде жатыр. Жұмыстың практикалық құндылығы ықтимал қауіпті дыбыстарды автоматты түрде анықтауға және ескерту сигналдарын жасауға қабілетті интеллектуалды аудио мониторинг жүйесін құруда көрінеді, бұл қауіпсіздік деңгейін арттырады және "ақылды қала" жүйелері мен маңызды инфрақұрылым нысандарын енгізу перспективаларын ашады. Технические характеристики системы. Разработанная система обнаружения опасных звуков базируется на гибридной архитектуре глубокого обучения, включающей сверточные и рекуррентные нейронные сети. Программный комплекс обеспечивает анализ аудиопотока в реальном времени с задержкой обработки не более нескольких миллисекунд. Система поддерживает классификацию по шести категориям звуковых событий: крик, плач, сирена, взрыв, выстрел и разбитие стекла. Программная реализация функционирует на сервере и поддерживает модульную интеграцию с внешними системами. Экономические и эксплуатационные показатели. Проект отличается низкими эксплуатационными затратами благодаря использованию открытых библиотек и фреймворков (Python, TensorFlow). Потенциал коммерциализации заключается в возможности применения системы в ситуационных центрах, на объектах транспортной и критической инфраструктуры, а также в учреждениях образования и здравоохранения. Внедрение системы позволяет снизить затраты на мониторинг и повысить скорость реагирования на чрезвычайные ситуации, что обеспечивает высокую социальную и экономическую эффективность проекта. Жүйенің техникалық сипаттамалары. Қауіпті дыбыстарды анықтаудың дамыған жүйесі конволюциялық және қайталанатын нейрондық желілерді қамтитын терең оқытудың гибридті архитектурасына негізделген. Бағдарламалық жасақтама бірнеше миллисекундтан аспайтын өңдеу кідірісімен нақты уақыттағы аудио ағынды талдауды қамтамасыз етеді. Жүйе дыбыстық оқиғалардың алты санатына жіктеуді қолдайды: айқайлау, жылау, сирена, жарылыс, ату және әйнектің сынуы. Бағдарламалық жасақтама серверде жұмыс істейді және сыртқы жүйелермен модульдік интеграцияны қолдайды. Экономикалық және пайдалану көрсеткіштері. Жоба ашық кітапханалар мен фреймворктарды (Python, TensorFlow) пайдаланудың арқасында төмен техникалық қызмет көрсетумен сипатталады. Коммерцияландыру әлеуеті жүйені ахуалдық орталықтарда, Көлік және сыни инфрақұрылым объектілерінде, сондай-ақ білім беру және денсаулық сақтау мекемелерінде қолдану мүмкіндігі болып табылады. Жүйені енгізу мониторинг шығындарын азайтуға және төтенше жағдайларға ден қою жылдамдығын арттыруға мүмкіндік береді, бұл жобаның жоғары әлеуметтік және экономикалық тиімділігін қамтамасыз етеді. На данном этапе разработанные методы и алгоритмы находятся на стадии научно-исследовательской и экспериментальной апробации и не внедрены в практическую деятельность. Основные результаты проекта включают создание прототипов моделей глубокого обучения и программных решений, прошедших лабораторные испытания и верификацию на тестовых наборах данных. Бұл кезеңде әзірленген әдістер мен алгоритмдер ғылыми-зерттеу және эксперименттік тестілеу сатысында және практикалық қызметке енгізілмеген. Жобаның негізгі нәтижелеріне терең оқыту үлгілерінің прототиптерін және сынақ деректер жиынында зертханалық сынақтан және тексеруден өткен бағдарламалық шешімдерді жасау кіреді. Эффективность реализации проекта проявляется в сочетании научных, технологических и социально-экономических результатов, обеспечивающих его высокую значимость для системы общественной безопасности. Разработанная интеллектуальная система обнаружения опасных звуков демонстрирует высокую производительность и точность классификации событий, что позволяет использовать её в реальном времени без задержек и с минимальными вычислительными затратами. Оптимизация архитектуры нейронной сети и алгоритмов обработки сигналов обеспечила достижение баланса между скоростью работы и качеством распознавания, что особенно важно для ситуационных центров и систем видеонаблюдения. С точки зрения социально-экономической эффективности проект способствует повышению уровня общественной безопасности за счёт оперативного реагирования на потенциально опасные звуковые события. Внедрение системы в инфраструктуру «умного города» позволит значительно сократить время реакции экстренных служб и предотвратить развитие чрезвычайных ситуаций. Кроме того, проект имеет образовательный и кадровый эффект, формируя новые компетенции в области искусственного интеллекта и обработки звуковых данных у молодых исследователей. Экономическая эффективность выражается в возможности масштабирования решения без значительных дополнительных затрат, а также в потенциале коммерциализации продукта на национальном и международном уровнях. Жобаны іске асырудың тиімділігі оның қоғамдық қауіпсіздік жүйесі үшін жоғары маңыздылығын қамтамасыз ететін ғылыми, технологиялық және әлеуметтік-экономикалық нәтижелердің үйлесімінде көрінеді. Қауіпті дыбыстарды анықтаудың интеллектуалды жүйесі оқиғаларды жіктеудің жоғары өнімділігі мен дәлдігін көрсетеді, бұл оны нақты уақыт режимінде кідіріссіз және минималды есептеу шығындарымен пайдалануға мүмкіндік береді. Нейрондық желі архитектурасын және сигналдарды өңдеу алгоритмдерін оңтайландыру жұмыс жылдамдығы мен тану сапасы арасындағы тепе-теңдікке қол жеткізді, бұл әсіресе ситуациялық орталықтар мен бейнебақылау жүйелері үшін өте маңызды. Әлеуметтік-экономикалық тиімділік тұрғысынан жоба ықтимал қауіпті дыбыстық оқиғаларға жедел ден қою арқылы қоғамдық қауіпсіздік деңгейін арттыруға ықпал етеді. Жүйені "ақылды қала" инфрақұрылымына енгізу шұғыл қызметтердің реакция уақытын едәуір қысқартуға және төтенше жағдайлардың дамуын болдырмауға мүмкіндік береді. Сонымен қатар, жоба жас зерттеушілерде жасанды интеллект және дыбыстық деректерді өңдеу саласында жаңа құзыреттерді қалыптастыра отырып, білім беру және кадрлық әсерге ие. Экономикалық тиімділік шешімді айтарлықтай қосымша шығындарсыз масштабтау мүмкіндігімен, сондай-ақ ұлттық және халықаралық деңгейде өнімді коммерцияландыру әлеуетімен көрінеді. Общественная безопасность и охрана правопорядка; Системы видеонаблюдения и умного города; Гражданская оборона и чрезвычайные ситуации; Транспортная инфраструктура. Қоғамдық қауіпсіздік және құқықтық тәртіпті қамтамасыз ету; Бейнебақылау жүйелері және "ақылды қала" инфрақұрылымы; Азаматтық қорғаныс және төтенше жағдайлардың алдын алу; Көлік инфрақұрылымы. |
||||
| UDC indices | ||||
| 004.8 | ||||
| International classifier codes | ||||
| 28.23.00; | ||||
| Key words in Russian | ||||
| Глубокое обучение; анализ звуковых данных; общественная безопасность; машинное слушание; искусственный интеллект; чрезвычайные ситуации; инновационные технологии; | ||||
| Key words in Kazakh | ||||
| Терең оқыту; Аудио деректерді талдау; Қоғамдық қауіпсіздік; Машиналық тыңдау; Жасанды интеллект; Төтенше жағдайлар; инновациялық технологиялар; | ||||
| Head of the organization | Ипалакова Мадина Тулегеновна | Кандидат технических наук / да, ассоциированный профессор | ||
| Head of work | Алтаева Айгерим Бакаткалиевна | Доктор PhD / старший преподаватель | ||