ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

3077
Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
Ерлан Кошанов: Наш народ сделал свой исторический выбор
Нормативное постановление Конституционного Суда Республики Казахстан от 18 марта 2026 года № 77-НП
Агния Барто – голос детства
Нацгвардия получила новые автомобили
Семилетие созидания и развития
«Кайрат» возглавил турнирную таблицу
Играя на струнах души
Возрождается природа, строит планы человек
В Шымкенте прошел республиканский конкурс «Жарапазан Fest»
Уверенность в завтрашнем дне
Вдохновленные весной
Тенденции и перспективы госслужбы
Игра, объединяющая поколения
Гостей встречает аул
Помнить о духовных скрепах
Современная и ориентированная на человека
Повышен уровень защиты
Логика реформ - 6: Окно возможностей в меняющемся мире
В интересах кибербезопасности
Тема встречи – обсуждение итогов референдума
Гвардейцы встретились со школьниками в Астане
Военная семья – надежный тыл: семья Таубаевых
Наурызнама: национальные узоры в форме и на технике гвардейцев
Гвардеец знает наизусть около 100 кюев
В воинской части 5451 Нацгвардии провели церемонию «Тұсаукесер»
Военнослужащие провели благотворительную акцию в Павлодаре
Рост сельхозпроизводства зафиксирован в Казахстане
Референдум – 2026: весь личный состав МВД переведен на усиление
В Атырау начал работу особенный магазин
Олжас Бектенов проголосовал на республиканском референдуме
Опубликован текст новой Конституции Казахстана
Более 200 мероприятий пройдет в Астане в честь празднования Наурыза
Ваш выбор не просто галочка в бюллетене, а веское слово за Народную Конституцию – Токаев обратился к молодежи
Победы на турнире Alem Cup
240 единиц нового оборудования предоставит GIZ бассейновым водным инспекциям Казахстана
МЧС внедряет дроны с ИИ для спасательных операций
Референдум-2026: Обновлены данные по явке
Семь вкусов благополучия. Что готовят на Наурыз?
Весна начинается с рукопожатия
На реках начали дробление льда
На страже неба: женское лицо авиации
Мужской хор Нацгвардии поздравил женщин столицы
В Конаеве начали строить КОС
Семь лет уверенного созидательного лидерства
Победитель UAE SWAT Challenge 2026 встретился со школьниками
Хор Нацгвардии произвел фурор на музыкальном шоу
Гвардеец стал призёром международных соревнований по дрон-рейсингу в Астане
Арсен Томский подарил автомобиль отцу олимпийского чемпиона Михаила Шайдорова
Наука: от конституционного статуса к технологическому суверенитету
Морозы возвращаются в Казахстан
Подставить вовремя плечо
Роналду начал переговоры о возвращении в Европу
Без наценок и посредников
В Карагандинском зоопарке – пополнение
Учебник как инструмент успеха
Развитие человеческого капитала в контексте реформ Президента
Слово о замечательном человеке
Фундамент новой эпохи независимого Казахстана
Семь человек погибло при взрыве в кафе Щучинска
«Барыс» готовится к досрочному отпуску

Читайте также

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]