Национальный цифровой словарь создадут в Казахстане: депутаты приняли закон
Фото: Pixabay.com
В Казахстане откроют словарный фонд Казахского языка, он будет работать на основе нейросетей, сообщает Orda.kz.
Законопроект «О внесении дополнений в Закон Республики Казахстан «О культуре» приняли 4 декабря в мажилисе парламента. Фонд займётся сохранением и защитой казахского языка, как культурной ценности. Для этого создадут единую государственную информационную систему — Национальный словарный фонда казахского языка. Он обеспечит доступ к словарному фонду казахского языка, основанному на Национальном корпусе казахского языка, содержащем тексты всех жанров и стилей.
«В целях обработки, генерации и анализа текстов на казахском языке законопроектом предлагается создание большой языковой модели казахского языка, основанной на технологии искусственных нейронных сетей. В ходе рассмотрения законопроекта депутатами были предусмотрены нормы, направленные на регламентацию института наставничества и решение вопросов образования», говорится в заключении к законопроекту.
Кроме того, расширяются возможности обучения по программе международной стипендии «Болашак» на уровне бакалавриата для победителей международных олимпиад и конкурсов научных проектов и исполнителей, перечень которых будет определяться Республиканской комиссией по подготовке кадров за рубежом. При этом обучаться в ведущих зарубежных вузах можно будет при условии соответствия выбранной победителями специальности предмету олимпиады или конкурса и безусловного их зачисления на академическое обучение.
Кроме того, создание словаря поможет научить нейросети лучше распознавать и переводить тексты на казахский язык.
«Есть Chat GPT, есть "Алиса", чтобы все это хорошо работало, нужен унифицированный словарь, то есть, языковая информационная система. Создание цифрового словаря и его доступность помогут искусственному интеллекту качественно говорить на казахском языке. Важно отметить, что это тяжелый процесс, потому что человек воспринимает слова интуитивно, в зависимости от смысла и ритма звучания слов. У ИИ нет такой интуиции, там это все — алгоритм. Например, мы должны одно слово использовать в 500 разных контекстах. Если этого контекста не дать, робот не поймет, как его правильно использовать. Поэтому это большая работа, не просто словарь», сказал депутат Асхат Аймагамбетов.
Словарь будет открытой и доступной системой, созданной для того, чтобы обеспечить постоянный доступ к правилам казахского языкам для широкой аудитории. Он будет бесплатным.
Таким образом, национальный словарь станет «главным справочником» казахского языка. Так как любой человек сможет быстро найти правильное написание или точное значение слов.
Читайте также:
Лента новостей
- Аэропорт Алматы временно закроет главный въезд
- В Алматы вынесли приговор «казахстанскому Робин Гуду»: почему мошенники попали под амнистию
- Что изменилось для казахстанцев в правилах пребывания в Кыргызстане
- ЕС обозначил новую роль Казахстана в отношениях с Европой
- На юге осудили сельчанина, который держал детей в рабстве
- Врачи рассказали о состоянии бабушки, которую внук ранил ножом в Актобе
- На фоне мощного укрепления тенге банки перестали выдавать доллары
- Школьник убил женщину, надругался над телом и выбросил на свалку в Шымкенте
- Грязный воздух убивает казахстанцев: депутаты требуют изменить законы
- Молодая девушка спрыгнула с моста в Астане
- Осквернили мусульманские могилы — школьников задержали в Атырау
- Ждать ли алматинцам повторного землетрясения в ближайшее время
- Фонограмма больше не прокатит: какие ещё новые правила в Казахстане утвердил Токаев
- Рабочий погиб на стройке в Мангистау, ЧП пытались скрыть
- Пожарили курицу на Вечном огне — полицейские разыскивают злоумышленника в ВКО
- За групповое изнасилование девочки подросткам прибавили сроки в Таразе
- Талибы заставили 13-летнего подростка казнить осуждённого перед тысячами зрителей
- Почему при курсе 500 цены не падают? Ответ экономиста
- Впервые за 20 лет косули массово идут в Казахстан из Сибири
- Анонимные телеграм-каналы должны будут раскрывать владельцев



