Inventory number | IRN | Number of state registration | ||
---|---|---|---|---|
0324РК01945 | AP19677733-KC-24 | 0123РК00780 | ||
Document type | Terms of distribution | Availability of implementation | ||
Краткие сведения | Gratis | Number of implementation: 0 Not implemented |
||
Publications | ||||
Native publications: 2 | ||||
International publications: 1 | Publications Web of science: 1 | Publications Scopus: 0 | ||
Patents | Amount of funding | Code of the program | ||
0 | 30832128 | AP19677733 | ||
Name of work | ||||
Разработка интеллектуальной распределенной системы параллельного анализа научных текстов | ||||
Type of work | Source of funding | Report authors | ||
Applied | Алтынбек Серік Атақонысұлы | |||
0
0
0
0
|
||||
Customer | МНВО РК | |||
Information on the executing organization | ||||
Short name of the ministry (establishment) | Нет | |||
Full name of the service recipient | ||||
"Казахский университет технологии и бизнеса имени К. Кулажанова" | ||||
Abbreviated name of the service recipient | «КазУТБ им. К.Кулажанова» | |||
Abstract | ||||
Объектом исследования являются различные типы научных статей, диссертаций, алгоритмы и подходы, используемые для обработки и анализа текстов, программные и аппаратные средства, необходимые для реализации системы, включая фреймворки для распределенных обработки больших данных. Зерттеу нысаны-ғылыми мақалалардың әртүрлі түрлері, диссертациялар, мәтіндерді өңдеу және талдау үшін қолданылатын алгоритмдер мен тәсілдер, жүйені іске асыруға қажетті бағдарламалық және аппараттық құралдар, соның ішінде үлестірілген үлкен деректерді өңдеуге арналған құрылымдар. Развертывание распределенной интеллектуальной системы анализа научных текстов, на основе математических методов и быстрых алгоритмов параллельной обработки данных для повышения качества научных работ и научной независимости. Ғылыми жұмыстардың сапасын және ғылыми тәуелсіздікті арттыру үшін математикалық әдістер мен деректерді параллель өңдеудің жылдам алгоритмдері негізінде ғылыми мәтіндерді талдаудың таратылған интеллектуалды жүйесін қолдану. − теоретический анализ методической, технической литературы по исследуемой проблеме; − топология естественного языка в метрических пространствах; − статистические методы гауссовского распределения и формула вероятностей Байеса; − морфологические и синтаксические анализаторы текста для автоматизации его представления на языке представления знаний; − мягкие вычисления для более удобной манипуляции неструктурированными данными; − методы data mining для обработки базы знаний и документов; − экспертные системы для разработки решателей задач с четким и нечетким выводом; − технологии объектно-ориентированного программирования для разработки программных приложений; − технологии Model-View-Controller; − пост-реляционной объектно-ориентированной системы управления базами данных MongoDB, HBase для создания базы данных и знаний; − agile для руководства процессом разработки программного обеспечения. - зерттелетін мәселе бойынша әдістемелік, техникалық әдебиеттерді теориялық талдау; - метрикалық кеңістіктегі табиғи тіл топологиясы; - Гаусс үлестірімінің статистикалық әдістері және Байес ықтималдық формуласы; - білімді ұсыну тілінде оны ұсынуды автоматтандыру үшін мәтіннің морфологиялық және синтаксистік анализаторлары; - құрылымдалмаған деректерді ыңғайлы манипуляциялау үшін жұмсақ есептеу; - білім базасы мен құжаттарды өңдеуге арналған data mining әдістері; - нақты және анық емес қорытындысы бар есептерді шешушілерді әзірлеуге арналған сараптамалық жүйелер; -бағдарламалық қосымшаларды әзірлеуге арналған объектіге бағытталған бағдарламалау технологиялары; -Model-View-Controller технологиялары; -MongoDB, HBase реляциядан кейінгі объектіге бағытталған мәліметтер базасын басқару жүйесі, мәліметтер базасын құру және білім; - бағдарламалық жасақтаманы әзірлеу процесін басқаруға арналған agile. Научная новизна проекта обеспечивается внедрением технологий распределённого хранения и параллельной обработки научных текстов, на основе математического аппарата, разработкой математических методов обработки знаний, статистики, теории информации и быстрых алгоритмов обработки данных. Разработана первоначальная версия распределенной информационной системы на основе фреймворка ApacheSpark, технологий разработки NODE.JS И SCALA. Ведутся работы по разработке моделей анализа качества бизнес-процессов на основе методов машинного обучения, включая нечеткую логику, статистический анализ, методов теории информации и теории вероятностей, включая понятие энтропии и гауссовского распределения. Первоначальная версия портала размещена по следующей ссылке. http://project.esil.edu.kz:8085/session/signin Жобаның ғылыми жаңалығы математикалық аппарат негізінде ғылыми мәтіндерді үлестірілген сақтау және қатар өңдеу технологияларын енгізумен, білімді өңдеудің математикалық әдістерін, статистиканы, ақпарат теориясын және деректерді өңдеудің жылдам алгоритмдерін әзірлеумен қамтамасыз етіледі. Таратылған ақпараттық жүйенің бастапқы нұсқасы Apache Spark шеңберіне, NODE әзірлеу технологияларына негізделген.JS ЖӘНЕ SCALA. Машиналық оқыту әдістеріне, соның ішінде анық емес логикаға, статистикалық талдауға, ақпарат теориясы әдістеріне және ықтималдықтар теориясына, соның ішінде энтропия және Гаусс таралу тұжырымдамасына негізделген бизнес-процестердің сапасын талдау модельдерін әзірлеу бойынша жұмыстар жүргізілуде. Порталдың бастапқы нұсқасы келесі сілтеме бойынша орналастырылған. http://project.esil.edu.kz:8085/session/signin К числу основных конструктивных и технико-экономических показателей проекта можно отнести следующие: 1. Реализация распределенных архитектуры информационной системы за счет применения систем параллельной обработки данных, с возможностью интеграции новых функциональных блоков, горизонтального масштабирования. 2. Реализация алгоритмы анализа научных текстов путем выбора оптимальных алгоритмов обработки текста (NLP, машинное обучение) и подключения модулей для семантического анализа и извлечения данных. 3. Реализация дружественного интерфейс пользователя, с возможностью визуализации данных и результатов анализа и обеспечением безопасности и конфиденциальности 4. Экономическая эффективность проекта обеспечивается внедрением использованием Open Source (открытое программное обеспечение) с возможностью дальнейшего добавления функциональных модулей и масштабирования Жобаның негізгі сындарлы және техникалық-экономикалық көрсеткіштеріне мыналар жатады: 1. Жаңа функционалдық блоктарды интеграциялау, көлденең масштабтау мүмкіндігімен деректерді параллельді өңдеу жүйелерін қолдану арқылы ақпараттық жүйенің таратылған архитектурасын іске асыру. 2. Іске асыру ғылыми мәтіндерді талдау алгоритмдері мәтінді Өңдеудің оңтайлы алгоритмдерін таңдау арқылы (NLP, Машиналық оқыту) және семантикалық талдау мен деректерді алу үшін модульдерді қосу. 3. Деректерді және талдау нәтижелерін визуализациялау және қауіпсіздік пен құпиялылықты қамтамасыз ету мүмкіндігімен достық пайдаланушы интерфейсін іске асыру 4. Жобаның экономикалық тиімділігі функционалдық модульдерді одан әрі қосу және масштабтау мүмкіндігімен open Source (ашық бағдарламалық қамтамасыз ету) пайдалану арқылы енгізумен қамтамасыз етіледі не внедрено, имеется опытный образец. енгізілмеген, прототипі бар.
Результаты Проекта можно применять во всех образовательных учреждениях, компаниях, государственных и квазигосударственных структур, которые заинтересованы в продвижении принципов Академической Честности и меритократии. Жобаның нәтижелерін Академиялық адалдық пен меритократия қағидаттарын ілгерілетуге мүдделі барлық білім беру мекемелерінде, компанияларда, мемлекеттік және квазимемлекеттік құрылымдарда қолдануға болады. |
||||
UDC indices | ||||
519.816, 519.25 | ||||
International classifier codes | ||||
20.23.19; 20.53.17; 27.43.17; 20.19.27; | ||||
Key words in Russian | ||||
параллельные вычисления; энтропия; неструктурированные данные; нечеткая экспертная система; база знаний; интеллектуальная система; информационная система; антиплагиат; анализ текста; статистическая обработка данных; | ||||
Key words in Kazakh | ||||
параллельді есептеу; энтропия; құрылымданбаған деректер; бұлдыр сараптама жүйесі; білім базасы; интеллектуалды жүйе; ақпараттық жүйе; антиплагиат; мәтінді талдау; статистикалық деректерді өңдеу; | ||||
Head of the organization | Кулажанов Ернур Талғатұлы | / | ||
Head of work | Алтынбек Серік Атақонысұлы | PhD in Mathematics / - |