Inventory number IRN Number of state registration
0322РК00236 AP09260670-KC-22 0121РК00474
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 0
International publications: 4 Publications Web of science: 0 Publications Scopus: 3
Patents Amount of funding Code of the program
0 22339318 AP09260670
Name of work
Разработка методов и алгоритмов аугментации входных данных для модификации векторных вложений слов
Type of work Source of funding Report authors
Applied Пак Александр Александрович
0
1
3
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Abbreviated name of the service recipient ИИВТ
Abstract

Методы и алгоритмы аугментации входных данных для модификации векторных вложений слов

Сөздердің векторлық ендірілуін модификациялауға арналған кіріс деректерін көбейту әдістері мен алгоритмдері

изучить подходы для улучшения обобщающей силы моделями векторных вложений слов

векторлық кірістіру модельдерінің жалпылау қабілетін жақсарту тәсілдерін зерттеу

В исследовании будут использованы методы из следующих областей знаний: нейрокомпьютинг, теория графов, теория алгебры логики, теория функциональных систем и системный анализ, теория принятия решений, математическая лингвистика, фонетический и семантический анализ, теория вероятностей и математическая статистика, теория распознавания образов, технология разработки программного обеспечения. Также будут использованы современные достижения в области технологий искусственного интеллекта, как в теоретическом, так и в практическом плане, современные case средства проектирования и разработки программного обеспечения, технология объетно-ориентированного программирования, PM-технологии управления и анализа проекта.

Зерттеу келесі білім салаларындағы әдістерді қолданады: нейрокомпьютер, графтар теориясы, логика алгебрасының теориясы, функционалдық жүйелер мен жүйелерді талдау теориясы, шешімдер теориясы, математикалық лингвистика, фонетикалық және семантикалық талдау, ықтималдықтар теориясы және математикалық статистика, үлгіні тану теориясы. , әзірлеу технологиясы бағдарламалық қамтамасыз ету. Сондай-ақ, жасанды интеллект технологиялары саласындағы теориялық және практикалық тұрғыда заманауи жетістіктер, кейстерді жобалау және бағдарламалық қамтамасыз етуді әзірлеудің заманауи құралдары, объектіге бағытталған бағдарламалау технологиясы, жобаларды басқару және талдау үшін PM -технологиялары қолданылады.

протестированы и созданы методы и алгоритмы, а также комплекс программ для генерации корпусов для обучения векторных вложений слов, получены результаты численных экспериментов, а также cравнительный анализ и рекомендации по применению обойденных и синтезированных данных в обучении словесных вложений слов. опубликована 1 статья в рецензируемых научных изданиях, индексируемых в Science Citation Index Expanded базы Web of Science и (или) имеющих процентиль по CiteScore в базе Scopus не менее 35 (тридцати пяти) индексируемом в Scopus или Web of Sciences с ненулевым фактором,

әдістер мен алгоритмдер, сондай-ақ корпустарды құруға арналған бағдарламалар жиынтығы сыналды және жасалды. векторлық сөз тіркемелерін оқыту, сандық эксперименттердің нәтижелері, сондай-ақ салыстырмалы талдау және оқытуда айналма және синтезделген деректерді қолдану бойынша ұсыныстар алынды сөз тіркемелері. 1 мақала индекстелетін рецензияланатын ғылыми басылымдарда жарияланды Science Citation Index expanded Web of Science базасы және (немесе) базада citescore бойынша процентилі бар Scopus нөлдік емес факторы бар Scopus немесе Web of Sciences индекстелетін кемінде 35 (отыз бес) Scopus

Новый подход для повышения качества обучения нейросетевых языковых моделей для научных текстов на английском языке, математические модели, алгоритмы и методы для автоматического.

Ағылшын тіліндегі ғылыми мәтіндер үшін нейрондық желілердің тілдік модельдерін, математикалық модельдерді, мәтінді автоматты өңдеудің алгоритмдерін және әдістерін оқыту сапасын арттырудың жаңа тәсілі.

на данном этапе проекта внедрения не предусмотрено

жобаны іске асырудың осы кезеңінде еңгізу қарастырылмаған

Настоящий проект проводится эффективно на высоком научно-организационном уровне, чему свидетельствует перевыполнение заявленного плана по публикационной активности.

Бұл жоба жоғары ғылыми-ұйымдастырушылық деңгейде нәтижелі жүзеге асырылып жатқанын жариялау жұмыстарының белгіленген жоспарының артығымен орындалғаны дәлелдейді.

корпус покупательских рецензий можно будет применить для решения задач обработки естественного языка в приложении к задаче анализа тональности, корпус научных публикаций можно применить для разработки решений современных проблем наукометрии.

сатып алушылардың шолуларының корпусын табиғи тілді өңдеу мәселелерін шешу үшін тоналды талдау мәселесінің қосымшасында қолдануға болады, ғылыми басылымдар корпусын қазіргі ғылымометрия мәселелерінің шешімдерін жасау үшін қолдануға болады.

UDC indices
004.032.26, 004.032.22, 004.032.24
International classifier codes
28.23.37; 50.53.17; 28.23.19;
Key words in Russian
Обработка естественных языков; векторное вложения слов; здравый смысл; индуктивный байес; аугментация текстовых данных;
Key words in Kazakh
Табиғи тілддерді өңдеу; сөздерді векторлық ендіру; дұрыс мағына; индуктивті байес; мәтіндік деректерді аугментациялау;
Head of the organization Мутанов Галимкаир Мутанович Доктор технических наук / профессор
Head of work Пак Александр Александрович Кандидат технических наук / Assoc. Professor