ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

2210
Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
«Кайрат» стал лучшим клубом страны в 21-й раз!
На восстановление лесов потребуется около 10 лет
Мир, который принимает тебя
Путешествие в закулисье
Факультету журналистики ЕНУ – 15 лет
Распоряжение Главы государства о назначении
Рыбаки приветствуют путешественников
Библиотеки нового поколения
Рейды против загрязнения города
Прощай, Владимир Иванович!
Ведущие нейрохирурги мира собрались в Астане
В объективе камеры – глубинка
Здесь финансируют стратегические бизнес-идеи
Обсуждены вопросы коллективной безопасности
Территория впечатлений
Указ Президента Республики Казахстан о назначении
Указ Президента Республики Казахстан О мерах по совершенствованию системы государственного управления
Интерпретировать, объяснять, расставлять акценты
Закон Республики Казахстан О территориальной обороне Республики Казахстан
Закон Республики Казахстан О фондах целевого капитала и эндаумент-фондах (целевых капиталах)
День столицы: сколько дней отдохнут казахстанцы в начале июля
Закон Республики Казахстан
В Павлодаре выявлены грубые нарушения в работе филиала Национального центра экспертизы
На краю пропасти: как остановить человека от последнего шага
Очередной циклон с дождями и грозами надвигается на Казахстан
Президент подписал закон об амнистии к 30-летию Конституции РК
Из Рабочего поселка – в Париж
Когда региональная сила становится мировым аргументом
«Голос Турана-2025» собирает друзей
В Казахстане дети все чаще рождаются с врожденными патологиями
Состоялся телефонный разговор Президента Казахстана с Эмиром Катара
К 1 января 2026 года Минтруда пересмотрит размер минимальной заработной платы
Введена в строй новая подстанция
55 млн сеянцев высадили в лесном фонде Костанайской области за 4 года
В Казахстане стремительно растет интерес к исламским финансовым инструментам
Премии, гранты и благодарности получили журналисты от Президента
Спасатели учат детей правилам поведения при ЧС
Международный фестиваль детских театральных коллективов завершился в Таразе
Фарид Алиев: Реализация концепции «Закон и Порядок» должна носить системный характер
Казахстан ввёл запрет на полёты над шестью странами Ближнего Востока
Новая трикотажная фабрика работает на полную мощность
В Семее суд вынес решение о сносе 12 новых жилых комплексов
В Костанайской области строится завод по производству автокомпонентов
Антикор отреагировал на жалобы водителей фур в Актюбинской области
Алматинские врачи столкнулись с редчайшей патологией в мире
Назначен новый министр обороны Казахстана
Аграрии Туркестанской области собирают первый урожай арбузов
Закон и Порядок – основа созидания Справедливого Казахстана
В Атырауской области начался прием заявок на льготную ипотеку для медиков
Жителя области Жетісу пожизненно лишили водительских прав
Новый завод открыли в Атырау
Алматинцев предупредили о неспокойной ночи
Годовая мощность ветряной станции в Жезказгане составит 330 млн кВт·час
В Приаралье появится сеть метановых автозаправок
Новый рекреационный парк открыли в Сатпаеве
В Жезказгане построят современный Дворец школьников
В Уральске реконструируют набережную
Главе государства показали пассажирский вагон казахстанского производства
Развитие химической отрасли в Жамбылской области набирает темпы
В Актобе построен новый завод по производству агрохимикатов

Читайте также

В пилотном режиме
Юные спасатели Казахстана — в числе лучших на соревнованиях…
МЦРИАП упростил участие отечественных стартапов в госзакупк…
Вызовы современности: милитаризация и ядерная безопасность

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]