ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

2836
Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
Пенсии растут, обязательства усиливаются
Олимпиада, Азиада и чемпионаты мира
Сложная операция – уверенный результат
Тройной подарок
Лесной питомник строится на юге
У ветерана – праздник
Медицинский комфорт – дальним селам
Вот качусь я в санках...
Не капитан, а атаман
Святая к музыке любовь
Завершена газификация
Для души и для дела
В Приаралье продолжаются новоселья
Сколько нужно для счастья?
Расти должны не только цены
Есть музыканты в селах!
Санаторно-курортная отрасль выходит на новый уровень
Вместе – интереснее
Онлайн-мошенничество: почему люди поддаются на уловки и как защитить себя?
Подотраслям предложено дружить
В Нацгвардии начался новый учебный период
Налог на транспорт изменен в Казахстане
Автомобилестроение Казахстана демонстрирует рекордные показатели роста
В Семее открылся цех по выпуску молочной упаковки
Налоговые вычеты по ИПН в Казахстане: что изменится в 2026 году
Свыше 1,7 тысяч водительских удостоверений в РК аннулировали из-за медпоказаний
Покоритель космических высот
С новыми тарифами предложено подождать
Обширное интервью Президента анонсировали в Акорде
Токаев подписал закон, касающийся возврата незаконно приобретенных активов
Что изменится на железных дорогах Казахстана в 2026 году
Завод по производству кормов для домашних животных построят в Алматинской области
Токаев: Казахстан вступил в новый этап модернизации
Около 40 рейсов задерживаются в аэропорту Астаны
35 дворов обновят в этом году в Костанае
В Уголовный кодекс и УПК внесены дополнения
Афера сорвалась в кабинете директора
63 бункера для КГМ установят в Костанае
Налоговая реформа: информация по переходному положению
В Бюро нацстатистики сообщили о снижении цен на некоторые виды продуктов питания
Накануне Нового года в супермаркетах начнется продажа по низким ценам
115 лет Бауыржану Момышулы: имя, которое выбирают защитники Родины
Гвардейцы наполнили столицу новогодним настроением
Продажу удешевленной говядины через торговые сети масштабируют в Казахстане
Стипендии повысили студентам в Казахстане
Американец выплатил сотрудникам $240 млн премии после продажи своей компании
В ЗКО ввели в строй первую в РК модульную станцию по очистке сточных вод
В столице в честь Дня Независимости пройдет республиканская ярмарка ремесел
SMS-коды 1414 больше не используются в Казахстане
Президент Ирана прибыл в Акорду
Финансовую дисциплину и цифровизацию здравоохранения обсудили в Правительстве
Гвардейцы поздравили воспитанников детских домов с Новым годом
Жители села Шамши Калдаякова активно участвуют в преобразованиях
«Барыс» возвращается в зону плей-офф
К 105-летию Героя Советского Союза Жалела Кизатова издана книга
В Астане с начала года ликвидировали два мошеннических колл-центра
Поддержка педагогов – инвестиция в будущее страны
В тройке лидеров
Спецназу «Бүркіт» - 26 лет
Два завода в отрасли автомобилестроения готовятся к запуску в Костанае

Читайте также

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]