Inventory number IRN Number of state registration
0324РК00726 AP23489782-KC-24 0124РК00497
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 1 Publications Web of science: 0 Publications Scopus: 0
Patents Amount of funding Code of the program
0 41997718.5 AP23489782
Name of work
AutoCorrection: обучение с подкреплением от искусственного интеллекта для разработки само-корректирующихся языковых моделей
Type of work Source of funding Report authors
Applied Пак Александр Александрович
2
2
2
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
АО «Казахстанско-Британский технический университет»
Abbreviated name of the service recipient АО "КБТУ"
Abstract

Объектом исследования является система обучения с подкреплением от искусственного интеллекта (RLAIF) для создания само-корректирующихся языковых моделей. Данная система направлена на интеграцию механизмов автоматической корректировки в языковые модели, что позволяет им самостоятельно исправлять ошибки и улучшать качество генерации текста в режиме реального времени. Основное внимание уделяется разработке архитектуры, способной эффективно обрабатывать обратную связь от других моделей ИИ и оптимизировать алгоритмы корректировки на основе накопленного опыта.

Объектом исследования является система обучения с подкреплением от искусственного интеллекта (RLAIF) для создания само-корректирующихся языковых моделей. Данная система направлена на интеграцию механизмов автоматической корректировки в языковые модели, что позволяет им самостоятельно исправлять ошибки и улучшать качество генерации текста в режиме реального времени. Основное внимание уделяется разработке архитектуры, способной эффективно обрабатывать обратную связь от других моделей ИИ и оптимизировать алгоритмы корректировки на основе накопленного опыта.

Целью проекта является исследование и разработка учебно-ориентированной языковой модели со встроенными механизмами самокоррекции, которая при этом объединяет ключевые аспекты RLAIF для минимизации зависимости от обратной связи с человеком, что приводит к автономности и адаптивности языковых моделей.

Жобаның мақсаты адамның кері байланысына тәуелділікті азайту үшін RLAIF негізгі аспектілерін біріктіретін, автономды және бейімделгіш тіл үлгілерін тудыратын кіріктірілген өзін-өзі түзету механизмдері бар оқытуға бағытталған тіл үлгісін зерттеу және дамыту болып табылады.

использованы методы из следующих областей знаний: нейрокомпьютинг, теория графов, теория алгебры логики, теория функциональных систем и системный анализ, теория принятия решений, математическая лингвистика, фонетический и семантический анализ, теория вероятностей и математическая статистика, теория распознавания образов, технология разработки программного обеспечения

келесі білім салаларындағы әдістер қолданылды: нейрокомпьютер, графиктер теориясы, логикалық алгебра теориясы, функционалдық жүйелер теориясы және жүйелік талдау, шешімдер теориясы, математикалық лингвистика, фонетикалық және семантикалық талдау, ықтималдықтар теориясы және математикалық статистика, үлгіні тану теориясы, бағдарламалық жасақтаманы әзірлеу технологиясы

Было проведено исследование существующих методик в области обучения с подкреплением и языковых моделей на базе инструкций. Анализ современных подходов и инструментов, используемых в RLHF и RLAIF, для определения возможностей улучшения больших языковых моделей. Были разработаны критерии оценки эффективности больших языковых моделей в контексте RLHF и RLAIF. Были предложены метрики для оценки точности, скорости и надежности языковых моделей на базе инструкций в контексте предлагаемой задачи исследования. Были установлены параметры для оценки точности, скорости и надежности языковых моделей на базе инструкций. Был разработан набор данных для обучения БЯМ с подкреплением от искусственного интеллекта. Собран разнообразный и репрезентативный набор данных инструкции.

Нұсқаулықтар негізінде күшейтілген оқыту саласындағы қолданыстағы әдістемелер мен тілдік модельдерге зерттеу жүргізілді. Үлкен тілдік модельдерді жақсарту мүмкіндіктерін анықтау үшін RLHF және RLAIF-та қолданылатын заманауи тәсілдер мен құралдарды талдау. RLHF және RLAIF контекстінде үлкен тілдік модельдердің тиімділігін бағалау критерийлері жасалды. Ұсынылған тапсырма контекстінде нұсқаулыққа негізделген тілдік модельдердің дәлдігін, жылдамдығын және сенімділігін бағалау үшін көрсеткіштер ұсынылды зерттеу. Нұсқаулыққа негізделген тілдік модельдердің дәлдігін, жылдамдығын және сенімділігін бағалау үшін Параметрлер орнатылды. Жасанды интеллекттен күшейтілген ҮТМ-ді оқытуға арналған мәліметтер жиынтығы жасалды. Нұсқаулықтың әртүрлі және репрезентативті мәліметтер жиынтығы жинақталған.

Основные конструктивные показатели включают анализ и выбор современных методов и инструментов для обучения языковых моделей с подкреплением, разработку критериев оценки эффективности, а также создание репрезентативного набора данных инструкций, охватывающего различные сценарии применения. В технико-экономическом аспекте проект нацелен на повышение качества и производительности языковых моделей, оптимизацию затрат на обучение и тестирование за счёт использования более точных и структурированных данных, а также создание условий для улучшения эксплуатационных характеристик моделей в долгосрочной перспективе.

Дизайндың негізгі көрсеткіштеріне күшейту тіл үлгілерін оқытудың заманауи әдістері мен құралдарын талдау және таңдау, өнімділікті бағалау критерийлерін әзірлеу және әртүрлі қолдану сценарийлерін қамтитын нұсқаулық деректерінің өкілді жинағын құру кіреді. Техникалық-экономикалық аспектіде жоба тілдік модельдердің сапасы мен өнімділігін арттыруға, дәлірек және құрылымдық деректерді пайдалану арқылы оқыту және тестілеу шығындарын оңтайландыруға, сондай-ақ ұзақ мерзімді перспективада модельдердің өнімділігін арттыруға жағдай жасауға бағытталған. .

на данном этапе проекта внедрения не предусмотрено

жобаны іске асырудың осы кезеңінде еңгізу қарастырылмаған

Исследования выполнены на высоком уровне и соответствуют общепринятым требованиям, предъявляемым к научным проектам.

Зерттеулер жоғары деңгейде орындалды және ғылыми жобаларға қойылатын жалпы қабылданған талаптарға сәйкес келеді.

результаты проекта можно будет применить для решения задач обработки естественного языка

жобаның нәтижелерін табиғи тілді өңдеу мәселелерін шешу үшін қолдануға болады

UDC indices
004.8
International classifier codes
20.19.27;
Key words in Russian
обучение с подкреплением от человека; обучение от искусственного интеллекта; языковые модели с настройкой; самокорректирующиеся языковые модели; автономные языковые модели;
Key words in Kazakh
адамның байланысына негізделген оқытуды күшейту; жасанды интеллект негізінде оқыту; нұсқауларға бапталған тіл үлгілері; өзін-өзі түзететін тіл үлгілері; дербес тіл үлгілері;
Head of the organization Габдуллин Маратбек Тулебергенович PhD / Профессор
Head of work Пак Александр Александрович Кандидат технических наук / ассоциированный профессор