Национальный цифровой словарь создадут в Казахстане: депутаты приняли закон

cover Фото: Pixabay.com

В Казахстане откроют словарный фонд Казахского языка, он будет работать на основе нейросетей, сообщает Orda.kz

Законопроект «О внесении дополнений в Закон Республики Казахстан «О культуре» приняли 4 декабря в мажилисе парламента. Фонд займётся сохранением и защитой казахского языка, как культурной ценности. Для этого создадут единую государственную информационную систему — Национальный словарный фонда казахского языка. Он обеспечит доступ к словарному фонду казахского языка, основанному на Национальном корпусе казахского языка, содержащем тексты всех жанров и стилей.

«В целях обработки, генерации и анализа текстов на казахском языке законопроектом предлагается создание большой языковой модели казахского языка, основанной на технологии искусственных нейронных сетей. В ходе рассмотрения законопроекта депутатами были предусмотрены нормы, направленные на регламентацию института наставничества и решение вопросов образования»,  говорится в заключении к законопроекту. 

Кроме того, расширяются возможности обучения по программе международной стипендии «Болашак» на уровне бакалавриата для победителей международных олимпиад и конкурсов научных проектов и исполнителей, перечень которых будет определяться Республиканской комиссией по подготовке кадров за рубежом. При этом обучаться в ведущих зарубежных вузах можно будет при условии соответствия выбранной победителями специальности предмету олимпиады или конкурса и безусловного их зачисления на академическое обучение. 

Кроме того, создание словаря поможет научить нейросети лучше распознавать и переводить тексты на казахский язык.

«Есть Chat GPT, есть "Алиса", чтобы все это хорошо работало, нужен унифицированный словарь, то есть, языковая информационная система. Создание цифрового словаря и его доступность помогут искусственному интеллекту качественно говорить на казахском языке. Важно отметить, что это тяжелый процесс, потому что человек воспринимает слова интуитивно, в зависимости от смысла и ритма звучания слов. У ИИ нет такой интуиции, там это все — алгоритм. Например, мы должны одно слово использовать в 500 разных контекстах. Если этого контекста не дать, робот не поймет, как его правильно использовать. Поэтому это большая работа, не просто словарь»,  сказал депутат Асхат Аймагамбетов.

Словарь будет открытой и доступной системой, созданной для того, чтобы обеспечить постоянный доступ к правилам казахского языкам для широкой аудитории. Он будет бесплатным. 

Таким образом, национальный словарь станет «главным справочником» казахского языка. Так как любой человек сможет быстро найти правильное написание или точное значение слов.

Читайте также: 

Лента новостей

все новости