ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

1907
Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
С портретов смотрят ветераны
Молодежь Астаны готовится к новоселью
Растут площади под масличные и кормовые культуры
Этих лет не смолкнет слава...
Трижды обманувший смерть
В Приаралье начался сев риса
Начато возведение крупного металлургического завода
Свекловичный жом пойдет на комбикорм
Выставка, посвященная 35-летию института президентства, открылась в Астане
Танец в небе: журавли вернулись
Вечная весна Алпысбая Казгулова
Гастротуризм: маршруты стали «вкуснее»
На принципах морали и человеколюбия
Он вернулся к звездам
Инвесторы предлагают построить несколько линий ЛРТ
Саксаул пустыне возвращает жизнь
Земля и люди Шардары
На перекрестке литературных миров
В Конаеве после модернизации открылась библиотека
«Пустых листков на моем календаре нет…»
Акимат Алматинской области ответил на жалобу автомобилистов
Ответственность за «овербукинг» вводят в Казахстане
Личный состав Нацгвардии перешел на летнюю форму одежды
Акмолинец выехал на встречную полосу прямо перед полицейскими
Автомобилисты жалуются на километровые пробки в Алматинской области
Взорвавшая мировые чарты башкирская группа Ay Yola удостоена почетных званий
Продвижение казахского языка и культуры обсудил Президент с главой «Яндекс Global»
Как убивали Шерзата Болата
В Казахстане стартовало профилактическое мероприятие «Безопасная дорога»
Вековой юбилей отметила фронтовичка из Караганды
По-прежнему бодр духом ветеран
Крупный металлургический завод начали строить в Жамбылской области
Куриное яйцо продолжает дешеветь в Казахстане
Наукограды способны повысить конкурентоспособность страны
В Италии выпустили коллекцию одежды с элементами казахской символики
Шанс для технологического прорыва
Казахстанская разработка представлена на EXPO 2025 в Японии
Химпром Мангистау: курс на модернизацию и устойчивое развитие
Повысить безопасность и минимизировать ущерб
Вековому юбилею посвящается
Как отдохнут казахстанцы на майские праздники
Казахстан – драйвер укрепления сотрудничества ЕС и ЦА
В хаосе городской застройки Уральска разбирался Антикор
Жительница Карагандинской области отсудила 10 млн тенге за проданный ей автомобиль с дефектом
Ветерана войны поздравили со 100-летним юбилеем
Когда наступит светлый праздник Ораза айт
Центр детского творчества «Самғау» открыли в Экибастузе
Мощное землетрясение зафиксировано в Таиланде и Мьянме
В Уральске трое неизвестных украли деньги из терминала
Самый отдаленный район Жамбылской области получит новый импульс развития
Туристический сезон стартовал в Туркестане
Экономическое развитие двух областей рассмотрели в правительстве РК
Результаты нужны, но переформатирование важнее
Qarmet подключится, и газ подешевеет
Ставка на справедливость и доверие
Улицы в честь ветеранов Великой Отечественной войны планируют назвать в Шымкенте
Инновационный завод в Мангистауской области: от науки к практике
В Талдыкоргане 15 человек уже год ждут купленные «по предзаказу» телефоны
Нацгвардия отдала дань памяти военнослужащим Казбата
Пятибалльное землетрясение произошло на юге Казахстана

Читайте также

Новые точки роста и возможности
Важно повышать электоральную культуру
Шухрат Ибрагимов, главный исполнительный директор ERG, пред…
Крестьянам нужны «длинные» деньги

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]