Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0324РК01422 | AP22787410-KC-24 | 0124РК00189 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 1 | ||||
International publications: 0 | Publications Web of science: 0 | Publications Scopus: 0 | ||
Patents | Amount of funding | Code of the program | ||
0 | 29989189.37 | AP22787410 | ||
Name of work | ||||
Разработка высокопроизводительной вопросно-ответной системы на казахском языке с использованием внешних источников знаний в специализированных областях | ||||
Type of work | Source of funding | Report authors | ||
Applied | Шоманов Адай Сакенович | |||
0
1
4
0
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | Нет | |||
Full name of the service recipient | ||||
Товарищество с ограниченной ответственностью "Astana IT University" | ||||
Abbreviated name of the service recipient | "Astana IT University" | |||
Abstract | ||||
Большие языковые модели Үлкен тілдік модельдер Повышение производительности вопросно-ответных моделей на казахском языке и снижение стоимости их разработки за счет оптимизации и точной настройки больших предобученных мультиязычных моделей. Көптілді алдын-ала оқытылған үлкен модельдерді дәл баптау және оңтайландыру арқылы қазақ тіліндегі сұрақ-жауап модельдерінің өнімділігін арттыру және олардың бағасын төмендету. В исследовании применялись современные методы обучения и оптимизации многоязычных моделей на основе архитектуры RoBERTa, специально адаптированных для казахского языка. Были тщательно проанализированы и выбраны оптимальные модели, подготовлены соответствующие наборы данных (KazQAD, NQ-Translate-KK, kz-transformers/multidomain-kazakh-dataset и другие), а также разработаны стратегии обучения с использованием продвинутых оптимизаторов и планировщиков скорости обучения, таких как OneCycleLR с фазой разогрева. Обучение проводилось на высокопроизводительных графических процессорах NVIDIA A100 для эффективной обработки больших объёмов данных. Зерттеуде қазақ тіліне арнайы бейімделген RoBERTa архитектурасына негізделген модельдерді оқыту және оңтайландырудың заманауи әдістері қолданылды. Оңтайлы модельдер мұқият талданып таңдалды, сәйкес деректер жиынтықтары (KazQAD, NQ-Translate-KK, kz-transformers/multidomain-kazakh-dataset және басқалар) дайындалды, сондай-ақ оқытудың озық оптимизаторлары мен қыздыру фазасымен OneCycleLR сияқты оқыту жылдамдығының жоспарлаушыларын пайдаланып оқыту стратегиялары жасалды. Үлкен көлемдегі деректерді тиімді өңдеу үшін оқыту NVIDIA A100 жоғары өнімді графикалық процессорларында жүргізілді. В результате были успешно разработаны и оптимизированы казахские модели на основе RoBERTa, такие как roberta-kaz-large и roberta-large-kazqad, которые показали высокую производительность и точность в задачах вопрос-ответ и ранжирования. Новизна работы заключается в эффективном применении современных методов обучения и оптимизации к малопредставленному казахскому языку, а также в создании специализированных наборов данных и моделей, способствующих улучшению качества обработки естественного языка для этого языка. Зерттеу нәтижесінде сұрақ-жауап және ранжирование тапсырмаларында жоғары өнімділік пен дәлдік көрсеткен roberta-kaz-large және roberta-large-kazqad сияқты RoBERTa негізіндегі қазақ модельдері сәтті жасалып, оңтайландырылды. Жұмыстың жаңалығы аз таралған қазақ тіліне заманауи оқыту және оңтайландыру әдістерін тиімді қолдануда, сондай-ақ осы тілдің табиғи тілді өңдеу сапасын жақсартуға ықпал ететін арнайы деректер жиынтықтары мен модельдерді жасауда болып табылады. Разработанные модели содержат 354 миллиона параметров и были обучены на графических процессорах NVIDIA A100, что обеспечило эффективное использование вычислительных ресурсов и сократило время обучения. Применение продвинутых методов оптимизации и планирования скорости обучения позволило достичь высокой точности при оптимальных затратах, делая модели пригодными для практического применения в реальных условиях. Жасалған модельдер 354 миллион параметрден тұрады және есептеу ресурстарын тиімді пайдаланып, оқыту уақытын қысқартқан NVIDIA A100 графикалық процессорларында оқытылды. Оңтайландырудың және оқыту жылдамдығын жоспарлаудың озық әдістерін қолдану жоғары дәлдікке қол жеткізуге мүмкіндік беріп, модельдерді нақты жағдайларда практикалық қолдануға жарамды етті.
Высокая Жоғары Приложения искусственного интеллекта, интеллектуальные информационные системы, человеко-машинные интерфейсы. Жасанды интеллект қолданбалары, интеллектуалды ақпараттық жүйелер, адам мен машина интерфейстері. |
||||
UDC indices | ||||
004.855 | ||||
International classifier codes | ||||
28.23.29; | ||||
Key words in Russian | ||||
Вопросно-ответные системы; Мультиязычные модели; Искусственный интеллект; Языковые модели; Семантические эмбеддинги; | ||||
Key words in Kazakh | ||||
Сұрақ-жауап жүйелері; Көптілді модельдер; Жасанды интеллект; Тілдік модельдер; Семантикалық кірістірулер; | ||||
Head of the organization | Хикметов Аскар Кусупбекович | Кандидат физико-математических наук / Профессор | ||
Head of work | Шоманов Адай Сакенович | Phd / нет |