ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

1598
Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
Сносить нельзя оставить
Кызылординский «Кайсар» будет играть без легионеров
На грани закрытия оказались частные детсады Петропавловска
Он жизнь свою Отчизне посвятил
В Алматы ученые обсуждали историко-культурное наследие Золотой Орды
Скоро на экраны выйдет продолжение культового фильма «Менің атым – Қожа»
Фронтовик дал бата гвардейцам
Создать устойчивую экосистему
Когда отходы превращаются в доходы
Как укрощается сталь
Разрабатывается проект генплана Туркестана
Основа стабильного будущего
От сердца к сердцу
Моя профессия – мое будущее
А за весною спешит лето...
Браконьеры наносят огромный ущерб
Любые конфликты можно разрешить за столом переговоров
Танцующие тени степей
Возраст спорту не помеха
Молодежь продвигает экологические инициативы
Возврат к историческому времени
Астана переходит в «умный» режим
В Атырау запланирована реконструкция центрального моста
Рассматривается возможность освобождения микро- и малого бизнеса от уплаты НДС
Мангистау составит конкуренцию мировым курортам
В стране раскрывается половина киберпреступлений
Дженерики, замещающие импорт
Два золота завоевала женская команда Казахстана по борьбе на турнире в Минске
Пешком и без денег путешествует Аскар Серикпаев
Картофель по 1340 тенге хотел купить ясли-сад в Павлодаре
Приоритеты климатической повестки
Саудовская Аравия готова принять переговоры о мире в Украине
Взрыв на шахте имени Костенко: 10 человек предстанут перед судом
Зеленский заблокировал сделку Трампа о природных ресурсах
В каком размере получают пособия по уходу за ребенком в Казахстане
Казахстанские спортсмены впервые завоевали два исторических золота на Азиаде
Усилить потенциал страны
Бейбит Жукаев впервые выиграл «Челленджер» в парном разряде
Односменка стала реальностью
Прагматичный подход – основной принцип модернизации
«Проблема из пальца высосана»: вице-министр – о прогреве автомашин более пяти минут
Кызылорда – наша гордость, слава, история
Горжусь тем, что говорю по-казахски
Буренки нынче довольны
В столичных торговых сетях сняли ограничения по реализации картофеля
Институциональное становление Академии наук завершено
Печальное событие произошло в семье Баян Алагузовой
Почти 30 млн тенге похитили чиновники из сферы образования в Туркестанской области
Арабская компания запускает новый проект в Казахстане
Парикмахерские услуги подорожали в Казахстане
Как в гимназии № 27 Алматы воспитывают всесторонне развитых личностей
Общественный туалет с уникальным дизайном построили в Шымкенте
Сбежавшего от полиции водителя привлекли к ответственности по 8 статьям в Таразе
Ученые исследовали происхождение казахских собак породы тобет
Резюмируя поручения Президента
Инфляция в Казахстане: в какой области растут цены
Бизнес в Семее сетует на бесконтрольное повышение тарифов
Сколько пенсионеров в Казахстане и какую пенсию они получают
История Каргалинского клада: в 1939 году республику взбудоражила весть о находке клада с золотом
Северный Казахстан демонстрирует успехи в АПК

Читайте также

В процедуру банкротства физических лиц внесены поправки
Гонка за ресурсами
Требования к безопасности труда ужесточат
Повышая инвестиционную привлекательность

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]