ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

188
Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
В МЧС достигли значительного снижения числа коррупционных правонарушений
76 сельских семей региона получили жилье от государства
Результаты, планы, перспективы
В столице завершился II республиканский конкурс Astana Piano Passion
От Чиангмая до Астаны
Два «золота» за два дня
Новые объекты образования
«Зеленые» облигации запускают в Алматы
Инновации для сельского хозяйства
Планируется внедрение института омбудсмена по защите прав потребителей
Долгостроев стало меньше
В Кызылорде прошла выставка-ярмарка «Ұлттық өнердің түнгі сыры»
В Нацгвардии определили лучших методистов
Аким проверил готовность объекта
Ценности прописных истин
Когда отходы станут доходами
Перспективы совместного проекта
ISSAI NU представил KAZ-LLM – казахскую большую языковую модель
Сильнейшие в Джакарте и на планете
Ответственное гражданство – путь к справедливому обществу
Опыт Шымкентского водоканала изучают эксперты Всемирного банка
Автоочередь образовалась на казахстанско-российской границе
В Узбекистане погибла известная бьюти-блогер, выпав из окна
Дело о секс-рабстве девочки из Кызылорды: оглашен второй приговор
О трендах, кадрах и науке госуправления
Это счастье – стать родителями
Акимат Жамбылской области сделал заявление по поводу митинга в Таразе
В Казахстане начнут собирать американские комбайны
В целях устойчивого развития
«Больше всех народом любим тот, кто в битве неколебим...»
Мост для межэтнического общения
Турция обяжет авиакомпании выплачивать компенсации за задержку рейсов
Когда цифры говорят сами за себя...
Как защититься от харассмента?
Более миллиона тонн казахстанского зерна за 10 месяцев экспортировали в Таджикистан
Лудоман проиграл похищенные 14 млн тенге в Караганде
Глава государства посетил сельскую школу близ Талдыкоргана
И дольше века газетный день
Как определить подделку 10-тысячной банкноты
В КазАТИУ состоялась встреча с участием членов Комиссии по правам человека
Россия – Казахстан: союз, востребованный жизнью и обращенный в будущее
Арест, штрафы и лишение прав: участников беспредельного кортежа наказали в Конаеве
Студентов, пенсионеров и домохозяек в РК освободят от обязательного декларирования доходов
«Южный вектор» открыт для бизнес-предложений
Казахстанских водителей предупредили о новом способе мошенничества
Президент подписал закон по вопросам реформирования жилищной политики
Махмуд Сабырхан нокаутом выиграл бой на ЧА по боксу
В Кызылординской области открылась первая «Комфортная школа»
На собственной «резине»: от Нижнекамска до Караганды
Увидеть Мангистау и запомнить навсегда
Президент посетил концерт, посвященный творчеству поэта Шомишбая Сариева
Главную сверхспособность человека, которой нет у ИИ, назвали эксперты
Кызылординский рис: от поля до стола
Грустные думки аграрные
Задачи прокуратуры – закон и порядок
Премьер провел оперативное совещание по поручениям главы государства
Токаев побеседовал с казахстанскими студентами в Будапеште
Токаев и Орбан посетили футбольный матч между сборными Венгрии и Германии
Лица старого Уральска
Производство шоколада может прекратиться

Читайте также

Так горько говорить «прощай…»
Отечественная экономика растет за счет несырьевого сектора
Перспективы совместного проекта
В Кызылорде прошла выставка-ярмарка «Ұлттық өнердің түнгі с…

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]