Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0324РК01263 | AP23487777-KC-24 | 0124РК00813 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 0 | ||||
International publications: 0 | Publications Web of science: 0 | Publications Scopus: 0 | ||
Patents | Amount of funding | Code of the program | ||
0 | 33930886 | AP23487777 | ||
Name of work | ||||
Развитие академической честности: выявление плагиата и атрибуция авторства с использованием контекстных вложений | ||||
Type of work | Source of funding | Report authors | ||
Fundamental | Кадыров Ширали Маратжанович | |||
0
1
2
0
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | МНВО РК | |||
Full name of the service recipient | ||||
"SDU University" | ||||
Abbreviated name of the service recipient | SDU University | |||
Abstract | ||||
Объектом исследования является развитие методов обнаружения плагиата и атрибуции авторства в академических и образовательных текстах с применением контекстных вложений. Проект объединяет лингвистические и компьютерные технологии, с использованием алгоритмов обработки естественного языка (NLP) и искусственного интеллекта (ИИ), для улучшения точности обнаружения плагиата и идентификации авторства в различных текстовых данных. Зерттеу нысаны контекстік тіркемелерді қолдана отырып, академиялық және білім беру мәтіндерінде плагиатты анықтау және авторлық атрибуция әдістерін дамыту болып табылады. Жоба әртүрлі мәтіндік деректердегі плагиатты анықтау және авторлық сәйкестендіру дәлдігін жақсарту үшін табиғи тілді өңдеу (NLP) және жасанды интеллект (AI) алгоритмдерін пайдалана отырып, лингвистикалық және компьютерлік технологияларды біріктіреді. Цель работы заключается в создании и внедрении моделей контекстных вложений, которые позволят повысить точность и адаптивность существующих систем обнаружения плагиата. С помощью новейших методов NLP проект направлен на обеспечение безопасной академической среды за счет более эффективного выявления различных форм плагиата, включая парафразирование и стилистические заимствования. Жұмыстың мақсаты-қолданыстағы плагиатты анықтау жүйелерінің дәлдігі мен бейімделуін жақсартуға мүмкіндік беретін контекстік қосымшалардың модельдерін құру және енгізу. NLP-дің соңғы әдістерімен жоба плагиаттың әртүрлі формаларын, соның ішінде парафразалау мен стилистикалық қарыздарды тиімді анықтау арқылы қауіпсіз академиялық ортаны қамтамасыз етуге бағытталған. базе BERT и GPT, а также тестирование алгоритмов классификации и внедрение контекстных вложений. Эти модели будут интегрированы в существующие алгоритмы обнаружения плагиата, включая модифицированные метрики косинусного и Жаккаровского сходства для оценки текстовой схожести. Bert және GPT, сондай-ақ жіктеу алгоритмдерін тестілеу және мәтінмәндік тіркемелерді енгізу. Бұл модельдер қолданыстағы плагиатты анықтау алгоритмдеріне, соның ішінде мәтіндік ұқсастықты бағалау үшін өзгертілген косинус пен Жаккаров ұқсастық көрсеткіштеріне біріктіріледі. Проект предлагает новый подход к обнаружению плагиата на основе контекстных вложений, что позволяет более точно идентифицировать стилистические и содержательные заимствования в тексте. Новизна проекта заключается в адаптации современных технологий NLP и глубокого обучения для более глубокого понимания языка, что способствует выявлению неявных случаев плагиата. Жоба мәтінмәндік тіркемелерге негізделген плагиатты анықтаудың жаңа әдісін ұсынады, бұл мәтіндегі стилистикалық және мағыналы қарыздарды дәлірек анықтауға мүмкіндік береді. Жобаның жаңалығы-заманауи NLP технологияларын бейімдеу және тілді тереңірек түсіну үшін терең оқыту, бұл плагиаттың жасырын жағдайларын анықтауға ықпал етеді. Основные показатели включают высокую точность идентификации авторства и обнаружения плагиата с использованием контекстных вложений, что позволяет улучшить производительность системы на 30% по сравнению с базовыми алгоритмами. Экономически проект выгоден благодаря возможности коммерциализации и интеграции разработок в образовательные и корпоративные системы. Негізгі көрсеткіштерге мәтінмәндік тіркемелерді қолдана отырып, авторлық сәйкестендірудің және плагиатты анықтаудың жоғары дәлдігі кіреді, бұл жүйенің өнімділігін негізгі алгоритмдермен салыстырғанда 30% жақсартуға мүмкіндік береді. Жоба білім беру және корпоративтік жүйелерге әзірлемелерді коммерцияландыру және интеграциялау мүмкіндігінің арқасында экономикалық тұрғыдан тиімді. Технологическая готовность разработанных моделей позволяет их интеграцию в существующие системы обнаружения плагиата. Планируется тесное сотрудничество с образовательными учреждениями, которые могут использовать данную технологию для повышения академической честности, а также с заинтересованными коммерческими партнерами. Әзірленген модельдердің технологиялық дайындығы оларды қолданыстағы плагиатты анықтау жүйелеріне біріктіруге мүмкіндік береді. Академиялық адалдықты арттыру үшін осы технологияны пайдалана алатын білім беру мекемелерімен, сондай-ақ мүдделі коммерциялық серіктестермен тығыз ынтымақтастық жоспарлануда. Ожидается значительное повышение эффективности в обнаружении плагиата, особенно в сложных случаях, таких как парафразирование. Валидация проекта на академических текстах подтверждает улучшение точности, что позволяет проекту успешно решать актуальные задачи в образовательной сфере и повысить уровень честности в учебном процессе. Плагиатты анықтауда, әсіресе парафразалау сияқты күрделі жағдайларда тиімділіктің айтарлықтай артуы күтілуде. Жобаны академиялық мәтіндерде валидациялау дәлдіктің жақсарғанын растайды, бұл жобаға білім беру саласындағы өзекті міндеттерді сәтті шешуге және оқу процесінде адалдық деңгейін арттыруға мүмкіндік береді. Технологии проекта ориентированы на использование в образовательных учреждениях, где требуется надежное средство для проверки текстов на плагиат. Также они могут быть полезны в журналистике, при создании контента, и в других сферах, где необходим анализ текстов на оригинальность и точное выявление авторства. Жобаның технологиялары плагиат мәтіндерін тексеру үшін сенімді құрал қажет болатын білім беру мекемелерінде қолдануға бағытталған. Олар сондай-ақ журналистикада, мазмұнды жасауда және мәтіндерді өзіндік ерекшелікке талдау және авторлықты дәл анықтау қажет басқа салаларда пайдалы болуы мүмкін. |
||||
UDC indices | ||||
004.021 | ||||
International classifier codes | ||||
20.00.00; 28.23.00; | ||||
Key words in Russian | ||||
Контекстуальные вложения; Перефразирование; Обнаружение плагиата; Идентификация авторства; Машинное обучение; Обработка естественного языка; Анализ текста; Образовательные технологии; | ||||
Key words in Kazakh | ||||
Контекстік тіркемелер; Парафраза; Плагиатты анықтау; Авторлық құқықты анықтау; Машиналық оқыту; Табиғи тілді өңдеу; Мәтінді талдау; Білім беру технологиялары; | ||||
Head of the organization | Игенбаев Алимжан Бекежанович | / нет | ||
Head of work | Кадыров Ширали Маратжанович | Phd / Доцент |