Inventory number IRN Number of state registration
0218РК01137 BR05236839-OT-18 0118РК01201
Document type Terms of distribution Availability of implementation
Промежуточный Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 17
International publications: 7 Publications Web of science: 0 Publications Scopus: 0
Number of books Appendicies Sources
0 6 76
Total number of pages Patents Illustrations
96 0 23
Amount of funding Code of the program Table
305000000 О.0861 19
Code of the program's task under which the job is done
01
Name of work
Разработка информационных технологий и систем для стимулирования устойчивого развития личности как одна из основ развития цифрового Казахстана
Report title
Type of work Source of funding The product offerred for implementation
Applied research Автоматизированная система
Report authors
Мусабаев Рустам Рафикович , Барахнин Владимир Борисович , Кожемякина (Шокина) Ольга Юрьевна , Пастушков Илья Сергеевич , Абдолдина Фарида Наурузбаевна , Мустакаев Ренат Рашидович , Кайрбеков Абылай Муратович , Якунин Кирилл Олегович , Кучин Ян Игоревич , Дуйсенбаева Асемгул Нуржановна , Сымагулов Адилхан , Абенов Махсут Мнайдарович , Шалтыков Нурлан Бахитжанович , Куанов Толыбай Джалилович , Уалиева Ирина Маратовна , Красовицкий Александр Михайлович , Мейрамбеккызы Жазираханым , Касымжанов Бек Кудайбергенович , Козбагаров Олжас Барлыкович , Сейтқали Даукен , Iglymov Alisher , Сагимбаев Жулдызжан , Аманбай Алтай , Джунусов Ибрагим Алпысбаевич , Ахметов Искандер Рафаилович , Abdullayeva Sabina , Нуртазин Абыз Темиргалиевич , Хисамиев Зариф Гарифуллинович , Шайбакова Дамина Дисингалеевна , Шахмаев Рашид Ахатович , Кулемзин Анатолий Альбионович , Меркебаев Азат Галымжанулы , Тасболатұлы Нұрболат , Дузбаев Талгат Толеубаевич , Нуржанов Чингиз Аскарович , Сапарходжаев Нурбек Пажарбекович , Айдарханов Даурен Талгатович , Нурзакова Жулдыз Аманжоловна , Исанова Айнура Сериковна , Мухамедиев Равиль , Ergaliyev Erlan , Шалқарбай-ұлы Ардақ , Ибраева Виктория Маратовна , Хорошилов Александр Алексеевич , Мукашев Айдос Шапанбаевич , Ахметов Султан Сметович , Машеева Ранна Уытбаевна , Младенович Ненад , Габбасов Марс Беккалиевич ,
0
0
0
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Abbreviated name of the service recipient ИИВТ
Abstract

Открытые электронные текстовые информационные источники новостного характера и их контент

Электронды мәтіндік ақпарат көздері мен олардың мазмұны

Целью данной работы являются исследование и разработка различных методик для оценки влияния открытых информационных источников на социум на основе анализа публикуемой текстовой информации и их алгоритмическая реализация в составе соответствующей информационно-аналитической системы.

Осы жұмыстың мақсаты - жарияланған мәтіндік ақпараттарды талдау және олардың ақпараттық-аналитикалық жүйе шеңберінде алгоритмдік іске асыру негізінде ашық ақпарат көздерінің қоғамға әсерін бағалаудың әр түрлі әдістерін зерттеу және дамыту.

Для достижения цели и решения задач исследования на каждом этапе работ применялись различные методы и подходы, такие как: социологический опрос, экспертный опрос, метод теоретического анализа и обобщения научной и аналитической литературы, аддитивный метод построения индексов, общенаучные методы наблюдения, систематизации, обобщения, статистический метод, лингвистические методы контекстуального, дискурсивного, интерпретативного, прагматического и компонентного анализа, интроспекция и др.

Мақсатқа жету және зерттеу мәселелерін шешу үшін жұмысдың әрбір кезеңінде: социологиялық зерттеу, сараптамалық шолу, ғылыми және аналитикалық әдебиеттерді синтездеу әдісі, индекстерді құрастырудың қосымша әдісі, байқау, жүйелеу, синтездеудің жалпы статистикалық әдістері, статистикалық әдістер сияқты түрлі әдістер мен тәсілдер пайдаланылды. әдіс, контекстік, дискурстық, түсіндірме, прагматикалық және компоненттік талдаудың лингвистикалық әдістері, интроспекция және т.б.

В результате исследования впервые был сформирован сбалансированный, представительный и размеченный корпус публицистических текстов общим объемом 5 400 текстов из 5 источников. Проведена лингвистическая разметка корпуса по 2000 текстам по результатам которой сформированы словари и формализованы правила по 4 признакам.

Зерттеу нәтижесі бойынша алғаш рет 5 көзден 5,4 мыңнан астам мәтінді құрайтын журналистік мәтіндердің теңдестірілген, өкілетті және таңдамалы корпусы құрылды. Корпустың лингвистикалық белгілері 2000 мәтін бойынша жүргізілді, оның нәтижелері бойынша сөздіктер құрылды және 4 ерекшеліктің ережелері ресімделді.

Создана модель для сбора данных по публикациям СМИ и проведения расчетов по методике получения интегральной оценки степени достоверности публикации, разработана концептуальная модель на основе словарей и сформулирована методика расчета генерализации текста, разработан алгоритм кластеризации и его программная реализация, разработано векторное и кластерное представления новостной информации, разработан метод классификации текстов, основанный на агрегировании значений субъективных вероятностей.

Массалық басылымдар туралы деректер жинау және жарияланымның сенімділік дәрежесін интегралды бағалау әдісін қолдана отырып, есептеулерді жасау үшін үлгі жасалды, сөздіктерге негізделген тұжырымдамалық үлгі әзірленді және мәтінді жалпылауды есептеудің тәртібі жасалды, кластерлік алгоритм және оның бағдарламалық жасақтамасы әзірленді, жаңалықтардың векторы мен кластерлік ұсыныстары әзірленді субъективті ықтималдық мәндерінің жиынтығына негізделген мәтінді жіктеу әдісі.

Результаты исследования будут применены для разработки автоматизированной системы оценки влияния открытых текстовых информационных источников на социум. Итоги исследования также будут полезны для применения в области политологии, социологии, журналистики, информационных технологий.

Зерттеудің нәтижелері ашық мәтіндік ақпарат көздерінің қоғамға әсерін бағалаудың автоматтандырылған жүйесін әзірлеу үшін қолданылатын болады. Зерттеудің нәтижелері саясаттану, әлеуметтану, журналистика, ақпараттық технологиялар саласында қолдану үшін пайдалы болады.

UDC indices
004.94
International classifier codes
20.53.00;
Readiness of the development for implementation
Key words in Russian
Информативные признаки; Информационная система; Разработка аналитических инструментов; Мониторинг; Социум; Валидация данных; Проектирование; Информационные источники; Аналитика;
Key words in Kazakh
Ақпараттық белгілер; Ақпараттық жүйе; Талдамалық құралдарды әзірлеу; Мониторинг; Қоғам; Деректерді тексеру; Жобалау; Ақпараттық дереккөздер; Талдау;
Head of the organization Калимолдаев Максат Нурадилович Доктор физико-математических наук / профессор
Head of work Мусабаев Рустам Рафикович Кандидат технических наук / ассоциированный профессор (доцент)
Native executive in charge