Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0324РК00726 | AP23489782-KC-24 | 0124РК00497 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 0 | ||||
International publications: 1 | Publications Web of science: 0 | Publications Scopus: 0 | ||
Patents | Amount of funding | Code of the program | ||
0 | 41997718.5 | AP23489782 | ||
Name of work | ||||
AutoCorrection: обучение с подкреплением от искусственного интеллекта для разработки само-корректирующихся языковых моделей | ||||
Type of work | Source of funding | Report authors | ||
Applied | Пак Александр Александрович | |||
2
2
2
0
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | МНВО РК | |||
Full name of the service recipient | ||||
АО «Казахстанско-Британский технический университет» | ||||
Abbreviated name of the service recipient | АО "КБТУ" | |||
Abstract | ||||
Объектом исследования является система обучения с подкреплением от искусственного интеллекта (RLAIF) для создания само-корректирующихся языковых моделей. Данная система направлена на интеграцию механизмов автоматической корректировки в языковые модели, что позволяет им самостоятельно исправлять ошибки и улучшать качество генерации текста в режиме реального времени. Основное внимание уделяется разработке архитектуры, способной эффективно обрабатывать обратную связь от других моделей ИИ и оптимизировать алгоритмы корректировки на основе накопленного опыта. Объектом исследования является система обучения с подкреплением от искусственного интеллекта (RLAIF) для создания само-корректирующихся языковых моделей. Данная система направлена на интеграцию механизмов автоматической корректировки в языковые модели, что позволяет им самостоятельно исправлять ошибки и улучшать качество генерации текста в режиме реального времени. Основное внимание уделяется разработке архитектуры, способной эффективно обрабатывать обратную связь от других моделей ИИ и оптимизировать алгоритмы корректировки на основе накопленного опыта. Целью проекта является исследование и разработка учебно-ориентированной языковой модели со встроенными механизмами самокоррекции, которая при этом объединяет ключевые аспекты RLAIF для минимизации зависимости от обратной связи с человеком, что приводит к автономности и адаптивности языковых моделей. Жобаның мақсаты адамның кері байланысына тәуелділікті азайту үшін RLAIF негізгі аспектілерін біріктіретін, автономды және бейімделгіш тіл үлгілерін тудыратын кіріктірілген өзін-өзі түзету механизмдері бар оқытуға бағытталған тіл үлгісін зерттеу және дамыту болып табылады. использованы методы из следующих областей знаний: нейрокомпьютинг, теория графов, теория алгебры логики, теория функциональных систем и системный анализ, теория принятия решений, математическая лингвистика, фонетический и семантический анализ, теория вероятностей и математическая статистика, теория распознавания образов, технология разработки программного обеспечения келесі білім салаларындағы әдістер қолданылды: нейрокомпьютер, графиктер теориясы, логикалық алгебра теориясы, функционалдық жүйелер теориясы және жүйелік талдау, шешімдер теориясы, математикалық лингвистика, фонетикалық және семантикалық талдау, ықтималдықтар теориясы және математикалық статистика, үлгіні тану теориясы, бағдарламалық жасақтаманы әзірлеу технологиясы Было проведено исследование существующих методик в области обучения с подкреплением и языковых моделей на базе инструкций. Анализ современных подходов и инструментов, используемых в RLHF и RLAIF, для определения возможностей улучшения больших языковых моделей. Были разработаны критерии оценки эффективности больших языковых моделей в контексте RLHF и RLAIF. Были предложены метрики для оценки точности, скорости и надежности языковых моделей на базе инструкций в контексте предлагаемой задачи исследования. Были установлены параметры для оценки точности, скорости и надежности языковых моделей на базе инструкций. Был разработан набор данных для обучения БЯМ с подкреплением от искусственного интеллекта. Собран разнообразный и репрезентативный набор данных инструкции. Нұсқаулықтар негізінде күшейтілген оқыту саласындағы қолданыстағы әдістемелер мен тілдік модельдерге зерттеу жүргізілді. Үлкен тілдік модельдерді жақсарту мүмкіндіктерін анықтау үшін RLHF және RLAIF-та қолданылатын заманауи тәсілдер мен құралдарды талдау. RLHF және RLAIF контекстінде үлкен тілдік модельдердің тиімділігін бағалау критерийлері жасалды. Ұсынылған тапсырма контекстінде нұсқаулыққа негізделген тілдік модельдердің дәлдігін, жылдамдығын және сенімділігін бағалау үшін көрсеткіштер ұсынылды зерттеу. Нұсқаулыққа негізделген тілдік модельдердің дәлдігін, жылдамдығын және сенімділігін бағалау үшін Параметрлер орнатылды. Жасанды интеллекттен күшейтілген ҮТМ-ді оқытуға арналған мәліметтер жиынтығы жасалды. Нұсқаулықтың әртүрлі және репрезентативті мәліметтер жиынтығы жинақталған. Основные конструктивные показатели включают анализ и выбор современных методов и инструментов для обучения языковых моделей с подкреплением, разработку критериев оценки эффективности, а также создание репрезентативного набора данных инструкций, охватывающего различные сценарии применения. В технико-экономическом аспекте проект нацелен на повышение качества и производительности языковых моделей, оптимизацию затрат на обучение и тестирование за счёт использования более точных и структурированных данных, а также создание условий для улучшения эксплуатационных характеристик моделей в долгосрочной перспективе. Дизайндың негізгі көрсеткіштеріне күшейту тіл үлгілерін оқытудың заманауи әдістері мен құралдарын талдау және таңдау, өнімділікті бағалау критерийлерін әзірлеу және әртүрлі қолдану сценарийлерін қамтитын нұсқаулық деректерінің өкілді жинағын құру кіреді. Техникалық-экономикалық аспектіде жоба тілдік модельдердің сапасы мен өнімділігін арттыруға, дәлірек және құрылымдық деректерді пайдалану арқылы оқыту және тестілеу шығындарын оңтайландыруға, сондай-ақ ұзақ мерзімді перспективада модельдердің өнімділігін арттыруға жағдай жасауға бағытталған. . на данном этапе проекта внедрения не предусмотрено жобаны іске асырудың осы кезеңінде еңгізу қарастырылмаған Исследования выполнены на высоком уровне и соответствуют общепринятым требованиям, предъявляемым к научным проектам. Зерттеулер жоғары деңгейде орындалды және ғылыми жобаларға қойылатын жалпы қабылданған талаптарға сәйкес келеді. результаты проекта можно будет применить для решения задач обработки естественного языка жобаның нәтижелерін табиғи тілді өңдеу мәселелерін шешу үшін қолдануға болады |
||||
UDC indices | ||||
004.8 | ||||
International classifier codes | ||||
20.19.27; | ||||
Key words in Russian | ||||
обучение с подкреплением от человека; обучение от искусственного интеллекта; языковые модели с настройкой; самокорректирующиеся языковые модели; автономные языковые модели; | ||||
Key words in Kazakh | ||||
адамның байланысына негізделген оқытуды күшейту; жасанды интеллект негізінде оқыту; нұсқауларға бапталған тіл үлгілері; өзін-өзі түзететін тіл үлгілері; дербес тіл үлгілері; | ||||
Head of the organization | Габдуллин Маратбек Тулебергенович | PhD / Профессор | ||
Head of work | Пак Александр Александрович | Кандидат технических наук / ассоциированный профессор |