ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

1360
Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
Охраняя покой мирных граждан
Полцарства за саукеле!
На улице – чище, на сердце – теплее
Как поменять пищевые привычки детей?
Регионы с общими климатическими проблемами должны сотрудничать для их решения
38 ПМСП построено в Северном Казахстане
Подведены итоги встреч депутатов с жителями регионов
Меценаты помогли открыть реабилитационный центр
Около ста семей стали обладателями квартир в Косшы
Присяга с... предложением руки и сердца
Система «Келешек» поможет сэкономить при оплате обучения
Вручены госстипендии в области культуры
Послания Главы государства оказали значительное влияние на развитие IT-индустрии нашей страны
Начало новой эры газовой отрасли: глава QazaqGaz рассказал об итогах 2024 года
Приняты меры против удорожания картофеля
Семь направлений и 70 шагов
Новое поколение управленцев
Спасено более полутора тысяч человек
Достояние человечества
Перемирие в Газе
Алматы – Туркестан – Ташкент – Самарканд – Шымкент – Алматы
Депутат высказалась об ажиотаже вокруг прогрева авто во дворах
Паспорта и удостоверения личности попробуют выдавать через терминалы
Умную мусорную корзину изобрел школьник из Астаны
В 2025 году 9 тыс. жителей Атырауской области получат адресную помощь
Пенсионеров избивали в частном пансионате Павлодара
Миссия – выстраивать мосты
О состоянии здоровья выжившей в Актобе заложницы рассказали врачи
Дело о смерти одноклассника: Верховный суд оставил решение без изменений
30-летие Ассамблеи народа Казахстана – важная веха политики единства и согласия
Гаухар Танашева утратила полномочия депутата Мажилиса
В Казахстане многодетным семьям снизят налоговую нагрузку
Срок действия платежных карточек сократят для нерезидентов РК
Глава государства выступит на саммите в Абу-Даби
Малыша оставили на вокзале Астаны: озвучены новые подробности дела
Нового депутата Мажилиса зарегистрировали в ЦИК РК
Пассажирка напала на сотрудника наземной службы FlyArystan
Назначен заместитель Главнокомандующего Нацгвардией МВД РК
Почти каждый второй тенге в общепите «съели» в Алматы и Астане
Сайгачьи стада: время трудных решений
Поздравление Главы государства Касым-Жомарта Токаева с Новым 2025 годом
Закон Республики Казахстан
Более 1,4 млн казахстанцев заблокировали возможность оформления займов без их ведома
Секс за золото: как живут женщины на нелегальных приисках Амазонки
Год единства и созидания
Одного из пассажиров потерпевшего крушение самолета AZAL сняли с рейса
Целый месяц рассчитывался за покупки найденной картой житель Аксая
Самолет рейса Баку - Грозный упал в Актау
В Атырау выявили частную школу без лицензии
Закон Республики Казахстан
Информацию об уходе Черчесова прокомментировали в КФФ
Смогут ли «Жетысу» и «Семей» настичь «Кайрат»?
Как изменятся пенсии и пособия в Казахстане в 2025 году
МВД обратилось к казахстанским водителям
В МВД разъяснили нормы, запрещающие прогревать авто во дворах
Новые госнаграды появились в Казахстане
Сигареты подорожают в РК
Путин извинился перед Алиевым за инцидент в небе над Актау
Главы государств и международных организаций поздравляют Токаева с Новым годом
Смертельная авария произошла на трассе в Павлодарской области

Читайте также

Казахстанские студенты взяли в Турине еще пять наград
Женский взгляд
Посуда из... пшеницы
Находка из средневековья

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]