Национальный цифровой словарь создадут в Казахстане: депутаты приняли закон
Фото: Pixabay.com
В Казахстане откроют словарный фонд Казахского языка, он будет работать на основе нейросетей, сообщает Orda.kz.
Законопроект «О внесении дополнений в Закон Республики Казахстан «О культуре» приняли 4 декабря в мажилисе парламента. Фонд займётся сохранением и защитой казахского языка, как культурной ценности. Для этого создадут единую государственную информационную систему — Национальный словарный фонда казахского языка. Он обеспечит доступ к словарному фонду казахского языка, основанному на Национальном корпусе казахского языка, содержащем тексты всех жанров и стилей.
«В целях обработки, генерации и анализа текстов на казахском языке законопроектом предлагается создание большой языковой модели казахского языка, основанной на технологии искусственных нейронных сетей. В ходе рассмотрения законопроекта депутатами были предусмотрены нормы, направленные на регламентацию института наставничества и решение вопросов образования», говорится в заключении к законопроекту.
Кроме того, расширяются возможности обучения по программе международной стипендии «Болашак» на уровне бакалавриата для победителей международных олимпиад и конкурсов научных проектов и исполнителей, перечень которых будет определяться Республиканской комиссией по подготовке кадров за рубежом. При этом обучаться в ведущих зарубежных вузах можно будет при условии соответствия выбранной победителями специальности предмету олимпиады или конкурса и безусловного их зачисления на академическое обучение.
Кроме того, создание словаря поможет научить нейросети лучше распознавать и переводить тексты на казахский язык.
«Есть Chat GPT, есть "Алиса", чтобы все это хорошо работало, нужен унифицированный словарь, то есть, языковая информационная система. Создание цифрового словаря и его доступность помогут искусственному интеллекту качественно говорить на казахском языке. Важно отметить, что это тяжелый процесс, потому что человек воспринимает слова интуитивно, в зависимости от смысла и ритма звучания слов. У ИИ нет такой интуиции, там это все — алгоритм. Например, мы должны одно слово использовать в 500 разных контекстах. Если этого контекста не дать, робот не поймет, как его правильно использовать. Поэтому это большая работа, не просто словарь», сказал депутат Асхат Аймагамбетов.
Словарь будет открытой и доступной системой, созданной для того, чтобы обеспечить постоянный доступ к правилам казахского языкам для широкой аудитории. Он будет бесплатным.
Таким образом, национальный словарь станет «главным справочником» казахского языка. Так как любой человек сможет быстро найти правильное написание или точное значение слов.
Читайте также:
Лента новостей
- В Алматы водитель сбил школьницу на «зебре» и скрылся
- В Акмолинской области женщина убила мужа и избежала наказания
- Жуткая авария на трассе ВКО: погибли пять человек
- В Туркестанской области стрелки в масках убили 17-летнего парня
- Сотни мёртвых тюленей на берегу Каспия: эксперты назвали причину гибели
- Более миллиона случаев ОРВИ зафиксировано в Казахстане — Минздрав
- Актёры, инфоцыгане и столовая: кого оштрафовали за незаконные розыгрыши в соцсетях
- Детская больница Шымкента переполнена из-за вспышки вируса
- Пьяная судья за рулём: МВД передало материалы в Генпрокуратуру
- Умер Дик Чейни, один из самых влиятельных вице-президентов США
- Большинство казахстанцев получают зарплату в 2,5 раза ниже средней
- Казахстанка стала чемпионкой мира по стрельбе из лука
- Казахстанец отсидит десять лет в колонии из-за сообщений в WhatsApp и Telegram
- Боль и ужас в Шу: как районная больница покалечила пациентку
- Казахстанские пейзажи увидели почти 700 миллионов человек по всему миру — рассказываем, кто их прославил
- Уроженку Казахстана разыскивает Интерпол. Бывший муж обвиняет её в похищении ребёнка
- Самурайский меч Карима Масимова продали на аукционе
- Редкий случай: обманутому пенсионеру вернули миллионы, похищенные мошенниками
- Бардак на таможне попытаются исправить цифровизацией
- Судьбу казахстанских активов «Лукойла» обсудят конфиденциально



