ISSAI Nazarbayev University представил KAZ-LLM — казахскую большую языковую модель
Фото: пресс-служба Акорды
Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили главе государства Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.
Применение KAZ-LLM повсеместно – от переводов казахского языка и генерации контента до обработки объемных текстов.
Адаптированный к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым и относится казахский язык.
Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т.е. слова или подслова), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.
Помимо этого ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области искусственного интеллекта.
Казахстанские исследователи участвовали во всех этапах процесса, от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.
Проект был начат в апреле этого года и тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.
«Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологической экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели, выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках», рассказал директор ISSAI, профессор NU Хусейн Атакан Варол.
ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширить эти модели для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и содействие значительному экономическому и технологическому влиянию в Казахстане и за его пределами.
Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline), а разработка велась независимо от государственного финансирования.
Информация предоставлена ISSAI Nazarbayev University
Читайте также:
Учёных в 10 раз меньше, чем в Канаде: в НАН при президенте РК назвали главную проблему науки
Лента новостей
- Ночная погоня в Таразе закончилась гибелью подростка
- В преддверии отпусков: казахстанцев предупредили об опасных инфекциях за границей
- В Кыргызстане засекреченное дело Ташиева передали в суд
- Смертельный субботник: в Кульсары под колёсами авто погиб сотрудник «КазТрансОйла»
- Рынок ожил? Продажи жилья в Казахстане резко пошли вверх
- Товары с маркировкой «Сделано в Казахстане» получат привилегии на маркетплейсах
- Приток иммигрантов из Китая в Казахстан вырос втрое в начале 2026 года
- Казахстанское мясо вне конкуренции — Минсельхоз
- Бизнес со школьной скамьи: как Shoqan School формирует новое поколение предпринимателей
- «Хайп» и «тупые люди»: блогер заявил, что помог Нургали Нугману создать резонанс вокруг «изнасилования»
- В Минэкологии объяснили штраф в 13 млн тенге за срыв одуванчиков
- «Прокололи лёгкое при иглоукалывании»: почему в ВКО решили прекратить уголовное дело
- Казахстанские НПЗ стали выжимать из нефти больше бензина, дизеля и битума
- Камеры, турникеты и вагоны над городом: как выглядит ЛРТ за несколько дней до запуска
- ForteBank увеличивает уставный капитал: совет директоров утвердил дополнительную эмиссию акций
- Жителя области Жетысу приговорили за насилие в отношении участкового и урон погонам
- Разыскиваемый экс-зять Масимова обратился к казахстанцам с заявлением
- В Казахстан снова придут ночные заморозки
- Дочери остались без отца: после поножовщины в Алматинской области умер 24-летний мужчина
- Высокие ставки перестают кормить банки Казахстана — аналитики



