ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
По следам легендарной Панфиловской дивизии
Слово об отважной Алие
Парад для Рзагула Байкешева
Благодарим и гордимся
«Делами благими рождается доброе имя…»
Елена Шмелева: «Сириус» в Казахстане – это единая развивающая среда для талантливой молодежи двух стран
«Посвящайте стихи солдатам...»
Сила духа и верность долгу
Вспоминая имена героев
Низкий поклон вам, воины Победы!
Память о войне священна
Поздравили героев
Студенты помогают пенсионерам освоить онлайн-сервисы
Виден флаг теперь издалека
Возвращение в элиту
Уроки памяти
Феномен «Ордабасы»
Спасибо, труженики тыла!
Вьется пыль из-под копыт!
Признательны за мужество и отвагу
Более 100 тысяч выпускников школ внесли вклад в озеленение страны
Дожди и шквалы накроют ряд регионов Казахстана
Соколы стали причиной паузы старта ракеты «Союз-5» на Байконуре
Полиция выявила схему вывоза ГСМ за границу
Город, соединявший континенты
Казахстанские месторождения получают вторую жизнь благодаря… нейросети
Дожди с грозами ожидаются в Казахстане
Казахскую тазы представили на международной выставке
В Астане начался второй этап LRT
В Алматы расширят выпуск спецтехники для ЧС
Токаев лично вмешался в дело задержанного в Польше казахстанца: подробности
Турнир по футболу «Кубок дружбы» объединил конфессии в Астане
«Чемпионы на льду»: мировые фигуристы устроили шоу в столице
Alibaba может войти в совет по развитию ИИ при Президенте РК
В Туркестанской области эвакуировали 81 человека из зоны подтопления
Участок объездной дороги в Астане перекроют на 10 дней
Казахстан обыграл Японию на ЧМ-2026 по хоккею
В Караганде детям возвращают слух с помощью имплантации
В Астане перекроют участок проспекта Тлендиева
«Фонд фондов» Казахстана привлек $95 млн для ИИ-проектов
В Нацгвардии внедряют камеры ИИ
В Нацгвардии – литературный челлендж
В Усть-Каменогорске житель получил вознаграждение за сдачу более 1 кг наркотиков
Легких прогулок не ожидается
Сельчанин построил бизнес на переработке отходов в Туркестанской области
Иллюзия вечной молодости: спортивный врач о мифах и реальности биохакинга
В Астане изменили схему движения автобусов
Будущих летчиков начнут готовить со школы в Актобе
Скандальный автокортеж на улицах Шымкента: 12 машин водворены на штрафстоянку
В Караганде открылся креативный экохаб
Запускается новый железнодорожный маршрут «Астана – Талдыкорган»
Звездный дуэт Чингиза Капина и Татьяны Турлай впервые выступил на столичной сцене
Не нарушайте – вас снимают!
ГЭС на Иртыше наращивает мощность
Каждый значимый инвестпроект в Казахстане будет под прокурорским сопровождением - Берик Асылов
В Астане нашли тайник с канистрами прекурсоров для производства наркотиков
Новые требования к приборам учёта воды ввели в Казахстане
Индекс старения населения заметно вырос в Казахстане
С четырьмя медалями завершила сборная Казахстана ЧА по греко-римской борьбе
Выстраивать отечественную систему цифрового управления отраслями

Читайте также

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]