ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
Спасибо за жизнь
Возрождение отрасли
Когда труд приносит радость
Столичные выпускники организовали благотворительную акцию
Хедлайнером международного фестиваля в ВКО станет Димаш Кудайберген
Там, где реальность переплетается со сказкой
Домбра Жамбыла – в дар музею
Наскальное послание из глубины веков
Город с особым характером
Освоены новые методы восстановления детей после ожогов
Это не игрушка!
Настоящая династия
Робототерапия вместо лекарств
Нейрохирургия страны вышла на мировой уровень
Памяти Сагитжана Бермаганбетова
Возвращение
Дастан Сатпаев уезжает в «Челси»
У дружбы четыре лапы
Не надо печалиться
Шаг в медицину будущего
Великий писатель земли кыргызской
Плотину на озере Иссык вновь вернут государству
Текели обретает новый стиль
Илон Маск стал первым в истории долларовым триллионером
Казахский помогает располагать к себе клиентов
Казахстанский художник победил на старейшем арт-фестивале Италии
Димаша Кудайбергена встретили в акимате Актюбинской области
Новые села на карте газоснабжения
Снижение турпотока ударило по гостиницам Алматы
Прокуратура защитила инвестора, строящего овощехранилище в Акмолинской области
Национальный каталог товаров меняет правила торговли
Матч открытия ЧМ-2026 по футболу вошёл в историю
Какие страны быстрее всех наращивают мощности солнечных электростанций
Задержан карагандинец, публиковавший в соцсетях попытки скрыться от полиции
Движение по дорогам Дарбаза – Мактаарал и Мойынты – Кызылжар запустят в ноябре
В Алматы представили роботакси
Казахстан вновь вошел в десятку лучших на этапе Кубка мира по стрельбе из лука
ШОС – 25 лет: новый рубеж, широкие перспективы
Подземные хроники Кангюя
Конституционный закон Республики Казахстан
Закон Республики Казахстан О государственной службе Республики Казахстан
Профессионал, спортсмен, семьянин, полиглот
Россия – Казахстан: союз в сердце Евразии
«Птичий дом» страны – в Коргалжыне
В Нацгвардии определили победителей турнира по мини-футболу
Где в мире самый быстрый рост числа миллиардеров
ИИ-решения для казахского языка
Лошадей Пржевальского выпустили в дикую природу на территории резервата «Алтын Дала»
Мудрый, добрый, человечный...
Мостостроителям дан срок до сентября
Бюджет, налоги и прозрачность: казашка рассказала о работе в администрации Мюнхена
Педагог с большой буквы
Саудиты стремительно достраивают самое высокое здание в мире
Казахстанцам с крупным первоначальным взносом снизят ставку по ипотеке
Как будут учиться студенты-медики: разъяснение мажилисмена
Сильные дожди с градом нагрянут в Казахстан
Начнут выращивать форель и осетра
Трёхлетний Амре получил Благодарственное письмо Главы государства
Золотые «орешки»: в чем феномен главного казахстанского герлз-бэнда
Права человека: новые акценты Конституции Казахстана

Читайте также

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]