Information card

You have disabled JavaScript ... To complete the work, you must enable JavaScript in your browser

Inventory number	IRN	Number of state registration
0324РК00726	AP23489782-KC-24	0124РК00497
Document type	Terms of distribution	Availability of implementation
Краткие сведения	Gratis	Number of implementation: 0 Not implemented
Publications
Native publications: 0
International publications: 1	Publications Web of science: 0	Publications Scopus: 0
Patents	Amount of funding	Code of the program
0	41997718.5	AP23489782
Name of work
AutoCorrection: обучение с подкреплением от искусственного интеллекта для разработки само-корректирующихся языковых моделей
Type of work	Source of funding	Report authors
Applied		Пак Александр Александрович
Engineers from production 2 Undergraduates 2 Doctoral students 2 Foreign scientists 0
Customer		МНВО РК
Information on the executing organization
Short name of the ministry (establishment)		МНВО РК
Full name of the service recipient
АО «Казахстанско-Британский технический университет»
Abbreviated name of the service recipient		АО "КБТУ"
Abstract
The object of research, development or design (in Russian) : Объектом исследования является система обучения с подкреплением от искусственного интеллекта (RLAIF) для создания само-корректирующихся языковых моделей. Данная система направлена на интеграцию механизмов автоматической корректировки в языковые модели, что позволяет им самостоятельно исправлять ошибки и улучшать качество генерации текста в режиме реального времени. Основное внимание уделяется разработке архитектуры, способной эффективно обрабатывать обратную связь от других моделей ИИ и оптимизировать алгоритмы корректировки на основе накопленного опыта. The object of research, development or design (in Kazakh) : Объектом исследования является система обучения с подкреплением от искусственного интеллекта (RLAIF) для создания само-корректирующихся языковых моделей. Данная система направлена на интеграцию механизмов автоматической корректировки в языковые модели, что позволяет им самостоятельно исправлять ошибки и улучшать качество генерации текста в режиме реального времени. Основное внимание уделяется разработке архитектуры, способной эффективно обрабатывать обратную связь от других моделей ИИ и оптимизировать алгоритмы корректировки на основе накопленного опыта. Aim of work (in Russian) : Целью проекта является исследование и разработка учебно-ориентированной языковой модели со встроенными механизмами самокоррекции, которая при этом объединяет ключевые аспекты RLAIF для минимизации зависимости от обратной связи с человеком, что приводит к автономности и адаптивности языковых моделей. Aim of work (in Kazakh) : Жобаның мақсаты адамның кері байланысына тәуелділікті азайту үшін RLAIF негізгі аспектілерін біріктіретін, автономды және бейімделгіш тіл үлгілерін тудыратын кіріктірілген өзін-өзі түзету механизмдері бар оқытуға бағытталған тіл үлгісін зерттеу және дамыту болып табылады. Методы исследования (на русском) : использованы методы из следующих областей знаний: нейрокомпьютинг, теория графов, теория алгебры логики, теория функциональных систем и системный анализ, теория принятия решений, математическая лингвистика, фонетический и семантический анализ, теория вероятностей и математическая статистика, теория распознавания образов, технология разработки программного обеспечения Методы исследования (на казахском) : келесі білім салаларындағы әдістер қолданылды: нейрокомпьютер, графиктер теориясы, логикалық алгебра теориясы, функционалдық жүйелер теориясы және жүйелік талдау, шешімдер теориясы, математикалық лингвистика, фонетикалық және семантикалық талдау, ықтималдықтар теориясы және математикалық статистика, үлгіні тану теориясы, бағдарламалық жасақтаманы әзірлеу технологиясы Obtained results and novelty (in Russian) : Было проведено исследование существующих методик в области обучения с подкреплением и языковых моделей на базе инструкций. Анализ современных подходов и инструментов, используемых в RLHF и RLAIF, для определения возможностей улучшения больших языковых моделей. Были разработаны критерии оценки эффективности больших языковых моделей в контексте RLHF и RLAIF. Были предложены метрики для оценки точности, скорости и надежности языковых моделей на базе инструкций в контексте предлагаемой задачи исследования. Были установлены параметры для оценки точности, скорости и надежности языковых моделей на базе инструкций. Был разработан набор данных для обучения БЯМ с подкреплением от искусственного интеллекта. Собран разнообразный и репрезентативный набор данных инструкции. Obtained results and novelty (in Kazakh) : Нұсқаулықтар негізінде күшейтілген оқыту саласындағы қолданыстағы әдістемелер мен тілдік модельдерге зерттеу жүргізілді. Үлкен тілдік модельдерді жақсарту мүмкіндіктерін анықтау үшін RLHF және RLAIF-та қолданылатын заманауи тәсілдер мен құралдарды талдау. RLHF және RLAIF контекстінде үлкен тілдік модельдердің тиімділігін бағалау критерийлері жасалды. Ұсынылған тапсырма контекстінде нұсқаулыққа негізделген тілдік модельдердің дәлдігін, жылдамдығын және сенімділігін бағалау үшін көрсеткіштер ұсынылды зерттеу. Нұсқаулыққа негізделген тілдік модельдердің дәлдігін, жылдамдығын және сенімділігін бағалау үшін Параметрлер орнатылды. Жасанды интеллекттен күшейтілген ҮТМ-ді оқытуға арналған мәліметтер жиынтығы жасалды. Нұсқаулықтың әртүрлі және репрезентативті мәліметтер жиынтығы жинақталған. The main constructive and technical economic indicators (in Russian) : Основные конструктивные показатели включают анализ и выбор современных методов и инструментов для обучения языковых моделей с подкреплением, разработку критериев оценки эффективности, а также создание репрезентативного набора данных инструкций, охватывающего различные сценарии применения. В технико-экономическом аспекте проект нацелен на повышение качества и производительности языковых моделей, оптимизацию затрат на обучение и тестирование за счёт использования более точных и структурированных данных, а также создание условий для улучшения эксплуатационных характеристик моделей в долгосрочной перспективе. The main constructive and technical economic indicators (in Kazakh) : Дизайндың негізгі көрсеткіштеріне күшейту тіл үлгілерін оқытудың заманауи әдістері мен құралдарын талдау және таңдау, өнімділікті бағалау критерийлерін әзірлеу және әртүрлі қолдану сценарийлерін қамтитын нұсқаулық деректерінің өкілді жинағын құру кіреді. Техникалық-экономикалық аспектіде жоба тілдік модельдердің сапасы мен өнімділігін арттыруға, дәлірек және құрылымдық деректерді пайдалану арқылы оқыту және тестілеу шығындарын оңтайландыруға, сондай-ақ ұзақ мерзімді перспективада модельдердің өнімділігін арттыруға жағдай жасауға бағытталған. . Level of implementation (in Russian) : на данном этапе проекта внедрения не предусмотрено Level of implementation (in Kazakh) : жобаны іске асырудың осы кезеңінде еңгізу қарастырылмаған Efficiency (in Russian) : Исследования выполнены на высоком уровне и соответствуют общепринятым требованиям, предъявляемым к научным проектам. Efficiency (in Kazakh) : Зерттеулер жоғары деңгейде орындалды және ғылыми жобаларға қойылатын жалпы қабылданған талаптарға сәйкес келеді. Field of application (in Russian) : результаты проекта можно будет применить для решения задач обработки естественного языка Field of application (in Kazakh) : жобаның нәтижелерін табиғи тілді өңдеу мәселелерін шешу үшін қолдануға болады
UDC indices
004.8
International classifier codes
20.19.27;
Key words in Russian
обучение с подкреплением от человека; обучение от искусственного интеллекта; языковые модели с настройкой; самокорректирующиеся языковые модели; автономные языковые модели;
Key words in Kazakh
адамның байланысына негізделген оқытуды күшейту; жасанды интеллект негізінде оқыту; нұсқауларға бапталған тіл үлгілері; өзін-өзі түзететін тіл үлгілері; дербес тіл үлгілері;
Head of the organization	Габдуллин Маратбек Тулебергенович	Academic degree/title: PhD / Профессор
Head of work	Пак Александр Александрович	Academic degree/title : Кандидат технических наук / ассоциированный профессор

Eng

Қаз

Рус