Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0324РК01164 | AP19680575-KC-24 | 0123РК01096 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 0 | ||||
International publications: 0 | Publications Web of science: 0 | Publications Scopus: 0 | ||
Patents | Amount of funding | Code of the program | ||
0 | 34594893 | AP19680575 | ||
Name of work | ||||
Машинное обучение для полуавтоматического формирования/генерации образовательного контента | ||||
Type of work | Source of funding | Report authors | ||
Applied | Уалиева Ирина Маратовна | |||
0
0
0
0
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | МНВО РК | |||
Full name of the service recipient | ||||
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК | ||||
Abbreviated name of the service recipient | ИИВТ | |||
Abstract | ||||
Объектом исследования являются методы текстового упрощения с самообучением для создания образовательного контента Зерттеу объектісі – білім беру саласына арналған мазмұнды құру үшін өз-өзін оқыту алгоритмдері арқылы мәтінді ықшамдау әдістерін дайындау. Цель работы – разработать новый языконезависимый, многодокументный метод текстового упрощения с самообучением (unsupervised ML) на основе анализа большого корпуса научных статей в области Computer Science. Затем задача упрощения текстов будет сформулирована в виде задачи глобальной оптимизации, которая будет осуществлять коллективное упрощение/реферирование содержимое множества документов и реализована в программной библиотеке. Жұмыстың мақсаты - информатика саласындағы ғылыми мақалалардың үлкен корпусын талдау негізінде өз-өзін оқыту алгоритмдері арқылы (бақылаусыз машиналық оқыту) мәтінді ықшамдаудағы, жаңа, тілге тәуелсіз, көп құжатты ықшамдау әдісін жасау. Одан кейін мәтіндерді ықшамдау тапсырманы глобалды оңтайландыру мәселесі ретінде қарастырып көп құжатты мазмұнды бірге ықшамдайтын/жинақтайтын бағдарламалық кітапханасын құру. Для достижения цели и решения задач исследования на каждом этапе работ применялись различные методы и подходы, такие как: анализ различных метрик упрощения текста; анализ большого корпуса на основе литературного контента, находящегося в открытом доступе; эксперименты для оценки производительности классификаторов с использованием индивидуальных и агрегированных признаков. Зерттеу мақсаттарына қол жеткізу және зерттеу міндеттерін шешу үшін әр кезеңде әртүрлі әдістер мен тәсілдер қолданылды, олар мыналар: мәтінді ықшамдаудың әртүрлі метрикаларын талдау; ашық қолжетімді әдеби контентке негізделген үлкен корпусқа талдау жүргізу; жеке және біріктірілген белгілерді пайдаланып классификаторлардың өнімділігін бағалау бойынша эксперименттер. Получены результаты исследования для оценки упрощения текста и критериев оценки удобочитаемости текста. Получены результаты экспериментов с существующими методами упрощения текста. Получены результаты исследований методов упрощения текстов для образовательного контента. Все полученные результаты обладают достаточной новизной. Мәтінді ықшамдау және мәтіннің оқылымдылығын бағалау критерийлерін бағалау бойынша зерттеу нәтижелері алынды. Қолданыстағы мәтінді ықшамдау әдістерімен эксперимент нәтижелері алынды. Білім контентін ықшамдау әдістері бойынша зерттеу нәтижелері алынды. Барлық алынған нәтижелер жеткілікті жаңашылдыққа ие. Основные конструктивные и технико-экономические показатели – новый метод текстового упрощения с самообучением, сформулированный в виде задачи глобальной оптимизации, который будет осуществлять коллективное упрощение/реферирование содержимое множества документов. Негізгі индикаторлар мәтінді өз-өзін оқыту алгоритмдері арқылы ықшамдаудың жаңа әдістері және оны көп құжатты мәтінгің мазмұнын ықшамдайтын/жинақтайтын глобалды оңтайландыру мәселесі түрінде құрастыру. Бірнеше құжаттың мазмұнын бірге жеңілдететін/қорытындылайтын жаһандық оңтайландыру мәселесі ретінде тұжырымдалған жаңа өздігінен үйрену мәтінін жеңілдету әдісі. Все выполненные работы направлены на получение единого конечного результата в виде разработанной программной библиотеки. Барлық орындалған жұмыстар әзірленген бағдарламалық кітапхана түріндегі бір түпкілікті нәтиже алуға бағытталған. Полученные результаты направлены на получение эффективных методов упрощения текстов. Алынған нәтижелер мәтіндерді ықшамдаудың тиімді әдістерін алуға бағытталған. научные и теоретические результаты, полученные в ходе этого проекта, будут использованы техническими писателями, разработчиками учебников/учебных пособий, школьными учителями, преподавателями ВУЗов и другими исследователями. Осы жоба барысында алынған ғылыми-теориялық нәтижелерді техникалық, оқулық/оқу құралдарын әзірлеушілер, мектеп мұғалімдері, университет профессорлары және басқа зерттеушілер пайдаланады. |
||||
UDC indices | ||||
004.8 | ||||
International classifier codes | ||||
20.01.00; | ||||
Key words in Russian | ||||
многодокументное упрощение текстов; семантический анализ; граф знаний; генерация образовательного контента; векторное представление знаний; | ||||
Key words in Kazakh | ||||
көп-құжатты мәтінді ықшамдау; семантикалық талдау; білім графигі; білім контентін құру; білім эмбедингі; | ||||
Head of the organization | Мутанов Галимкаир Мутанович | Доктор технических наук / профессор | ||
Head of work | Уалиева Ирина Маратовна | Кандидат физико-математических наук / - |