Inventory number IRN Number of state registration
0219РК00618 BR05236839-OT-19 0118РК01201
Document type Terms of distribution Availability of implementation
Промежуточный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 22
International publications: 24 Publications Web of science: 0 Publications Scopus: 0
Number of books Appendicies Sources
1 7 114
Total number of pages Patents Illustrations
109 0 6
Amount of funding Code of the program Table
325000000 О.0861 2
Code of the program's task under which the job is done
01
Name of work
Разработка информационных технологий и систем для стимулирования устойчивого развития личности как одна из основ развития цифрового Казахстана
Report title
Type of work Source of funding The product offerred for implementation
Applied research Автоматизированная система
Report authors
Мусабаев Рустам Рафикович , Касымжанов Бек Кудайбергенович , Ибраева Виктория Маратовна , Уалиева Ирина Маратовна , Красовицкий Александр Михайлович , Барахнин Владимир Борисович , Кожемякина (Шокина) Ольга Юрьевна , Мустакаев Ренат Рашидович , Кайрбеков Абылай Муратович , Якунин Кирилл Олегович , Кучин Ян Игоревич , Сымагулов Адилхан , Мейрамбеккызы Жазираханым , Козбагаров Олжас Барлыкович , Сейтқали Даукен , Iglymov Alisher , Сагимбаев Жулдызжан , Джунусов Ибрагим Алпысбаевич , Abdullayeva Sabina , Шахмаев Рашид Ахатович , Кулемзин Анатолий Альбионович , Меркебаев Азат Галымжанулы , Тасболатұлы Нұрболат , Дузбаев Талгат Толеубаевич , Нуржанов Чингиз Аскарович , Айдарханов Даурен Талгатович , Нурзакова Жулдыз Аманжоловна , Исанова Айнура Сериковна , Мухамедиев Равиль , Шалқарбай-ұлы Ардақ , Хорошилов Александр Алексеевич , Мукашев Айдос Шапанбаевич , Младенович Ненад , Төлеу Алымжан , Төлеген Гүлмира , Мурзахметов Санжар , Айтмухамбетова Гульнур Аманжоловна , Шокишалов Жасулан Маликулы , БЕКБАҒАНБЕТОВ АБАЙ РУСЛАНҰЛЫ , Анищенко Людмила Николаевна , Садырбаева Алия Ержанқызы , Сағындық Бексұлтан Нұрәлімұлы , Ашимов Аскар Абдыкаппарович , Булдыбаев Тимур Керимбекович , Атанаева Мираим Кажмухамбетовна ,
0
0
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Abbreviated name of the service recipient ИИВТ
Abstract

Открытые электронные текстовые информационные источники новостного характера и их контент

Электронды мәтіндік ақпарат көздері мен олардың мазмұны

Целью данной работы являются исследование и разработка различных методик для оценки влияния открытых информационных источников на социум на основе анализа публикуемой текстовой информации и их алгоритмическая реализация в составе соответствующей информационно-аналитической системы.

Осы жұмыстың мақсаты - жарияланған мәтіндік ақпараттарды талдау және олардың ақпараттық-аналитикалық жүйе шеңберінде алгоритмдік іске асыру негізінде ашық ақпарат көздерінің қоғамға әсерін бағалаудың әр түрлі әдістерін зерттеу және дамыту.

Для достижения цели и решения задач исследования на каждом этапе работ применялись различные методы и подходы, такие как: социологический опрос, экспертный опрос, метод теоретического анализа и обобщения научной и аналитической литературы, аддитивный метод построения индексов, общенаучные методы наблюдения, систематизации, обобщения, статистический метод, лингвистические методы контекстуального, дискурсивного, интерпретативного, прагматического и компонентного анализа, интроспекция, применялись технологии больших данных и машинного обучения и др.

Мақсатқа жету және зерттеу мәселелерін шешу үшін жұмысдың әрбір кезеңінде: социологиялық зерттеу, сараптамалық шолу, ғылыми және аналитикалық әдебиеттерді синтездеу әдісі, индекстерді құрастырудың қосымша әдісі, байқау, жүйелеу, синтездеудің жалпы статистикалық әдістері, статистикалық әдістер сияқты түрлі әдістер мен тәсілдер пайдаланылды. әдіс, контекстік, дискурстық, түсіндірме, прагматикалық және компоненттік талдаудың лингвистикалық әдістері, интроспекция, Үлкен деректер мен машиналық оқыту технологиялары қолданылды және т.б.

Созданы методики получения оценки влияния на социум открытых информационных источников на базе анализа текстовых публикаций (в численном виде): на базе тематической модели корпуса СМИ и на базе комплексной оценки различных информативных признаков. Начата разработка методики расчета отдельных критериев для оценки влияния открытых текстовых информационных источников на социум: разработаны и апробированы новый алгоритм тематического моделирования на основе кластерного подхода, метод автоматического установления тональности текстов методом их концептуального анализа, метод для автоматической численной оценки степени информативности публикаций, подход для автоматической классификации публикаций по типам, жанрам и стилям; проведен анализ методов, обеспечивающих выявление деструктивных сообщений в интернет-среде; проведена оценка выраженности информативных критериев на основе словарного подхода. Начата разработка информационной системы оценки влияния открытых текстовых информационных источников на социум: определены назначение, цели задачи, разработана архитектура и определены необходимость и достаточность функциональности информационной системы.

Ашық ақпарат көздерінің қоғамға әсерін бағалау әдістері мәтін жарияланымдар талдау негізінде құрылған (сандық түрде): медиа-дерекқордың тақырыптық моделіне негізделген, әр түрлі ақпараттық белгілері кешенді бағалау негізінде. Ашық мәтінді ақпарат көздерінің қоғамға әсерін бағалаудың жеке критерийлерін есептеу әдістемесін әзірлеу басталды: кластерлік тәсілге негізделген жаңа тақырыптық модельдеу алгоритмі, мәтіндердің үндестігін олардың тұжырымдамалық талдау әдісі арқылы автоматты түрде белгілеу әдісі, жарияланымдардың ақпараттық мазмұнының дәрежесін автоматты түрде сандық бағалау әдісі, жарияланымдарды түрі, жанры және стилі бойынша автоматты түрде жіктеуге арналған тәсіл әзірленді және сыналды; Интернет ортасындағы деструктивті хабарламаларды анықтау әдістерін талдау, лексикалық тәсіл негізінде ақпараттық критерийлердің ауырлығын бағалау өткізілді.

Созданы необходимые технические и экспертно-аналитические условия для разработки информационной системы: разработаны новые методы кластерного анализа, метод плотной тематической векторизации текстов, содержащихся в большом в текстовом корпусе (BigData), алгоритм группировки новостных публикаций в соответствии с информационными поводами, метод кластеризации новостных сообщений СМИ на основе их концептуального анализа, алгоритм кластеризации больших данных высокой размерности на основе метода декомпозиции, методы, алгоритмы и инструменты предобработки текстовых публикаций, метод автоматической суммаризации текстовых документов и методы оптимизации.

Ашық мәтінді ақпарат көздерінің қоғамға әсерін бағалаудың ақпараттық жүйесін дамыту басталды: мақсат, міндеттер анықталады, сәулет жобаланған және ақпараттық жүйенің жұмыс істеу қажеттілігі мен жеткіліктілігі анықталған. Ақпараттық жүйені дамыту үшін қажетті техникалық және сараптамалық-аналитикалық жағдайлар жасалды: кластерлік талдаудың жаңа әдістері, үлкен мәтіндік қорапта (BigData) орналасқан мәтіндерді тығыз тақырыптық векторландыру әдісі, жаңалықтар жарияланымдарын жаңалықтарға сәйкес топтастыру алгоритмі, ақпараттық медиа есептерін олардың тұжырымдамалық талдауы негізінде кластерлеу әдісі, ыдырау әдісіне негізделген үлкен өлшемді үлкен мәліметтерге арналған кластерлік алгоритм, мәтіндік жарияланымдарды өңдеудің әдістері, алгоритмдері мен құралдары, мәтіндік құжаттарды автоматты түрде жинақтау әдісі және оңтайландыру әдістері әзірленген.

Результаты исследования будут применены для разработки автоматизированной системы оценки влияния открытых текстовых информационных источников на социум. Итоги исследования также будут полезны для применения в области политологии, социологии, журналистики, информационных технологий.

Зерттеудің нәтижелері ашық мәтіндік ақпарат көздерінің қоғамға әсерін бағалаудың автоматтандырылған жүйесін әзірлеу үшін қолданылатын болады. Зерттеудің нәтижелері саясаттану, әлеуметтану, журналистика, ақпараттық технологиялар саласында қолдану үшін пайдалы болады.

UDC indices
004.94
International classifier codes
20.53.00;
Readiness of the development for implementation
Key words in Russian
Информативные признаки; Информационная система; Генерализация; Тональность; Кластеризация; Тематическое моделирование; Открытые информационные источники; СМИ; Обработка естественного языка; Машинное обучение; Большие данные; Интеллектуальный анализ текста; Извлечение ключевых фраз; Информационный повод;
Key words in Kazakh
Ақпараттық белгілер; Ақпараттық жүйе; Жалпылау; Көңіл-күй; Кластерлеу; Тақырыптық модельдеу; Ашық ақпараттық көздері; БАҚ; Табиғи тілді өңдеу; Машинамен оқыту; Үлкен деректер; Зияткерлік мәтінді талдау; Негізгі сөз тіркесін шығару; Ақпараттық оқиға;
Head of the organization Калимолдаев Максат Нурадилович Доктор физико-математических наук / профессор
Head of work Мусабаев Рустам Рафикович Кандидат технических наук / ассоциированный профессор (доцент)
Native executive in charge