ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

1799
Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
Как отдохнут казахстанцы на майские праздники
Президент поручил Досаеву навести должный порядок в Алматы
Гимнаст Зейнолла Идрисов одержал победу на турнире в Германии
Более 1,7 тыс. человек стали жертвами землетрясения в Мьянме
Календарь спортивных событий Казахстана и мира с 31 марта по 6 апреля
Нуркожа Кайпанов завоевал золото чемпионата Азии по вольной борьбе
В Казахстане примут новые поправки по ядерной безопасности
В Сети появились фото новой столицы Египта
Похитившего 50 млн тенге казахстанца экстрадировали из России
Баян Алагузова анонсировала необычный конкурс красоты
Одинокого пенсионера жестоко избили подростки в Темиртау
Президента Словении торжественно встретили в Акорде
В Южной Корее полностью потушили лесные пожары
Национальная гвардия – в числе лучших на чемпионате Министра обороны по самбо
Более 300 млн тенге выманила финпирамида у казахстанцев под видом кооператива
Впервые должность «педагога-профориентатора» официально закрепили в Казахстане
Казахстанских предпринимателей приглашают принять участие в конкурсе «Парыз - 2025»
В Алматы определили сильнейших самбистов среди силовиков: первыми стали спортсмены ЦСКА
Дмитрий Попко стал чемпионом крупного теннисного турнира в Мексике
Бесплатные лекарства не выдавали свыше 700 пациентам в ЗКО
Казахстан – драйвер укрепления сотрудничества ЕС и ЦА
Жительница Карагандинской области отсудила 10 млн тенге за проданный ей автомобиль с дефектом
Когда наступит светлый праздник Ораза айт
Ветерана войны поздравили со 100-летним юбилеем
Центр детского творчества «Самғау» открыли в Экибастузе
Туристический сезон стартовал в Туркестане
Мощное землетрясение зафиксировано в Таиланде и Мьянме
Большая удача, если сохранился медальон
Экономическое развитие двух областей рассмотрели в правительстве РК
На «Хабаре» вновь запустили популярную некогда программу
Олжас Бектенов встретился с главой китайской компании
Прогулочный батискаф потерпел крушение в Египте
Результаты нужны, но переформатирование важнее
В Южной Корее продолжают бушевать лесные пожары
Премьер поручил масштабировать опыт Павлодарской области по развитию ТиПО и поддержке рабочих профессий
Ставка на справедливость и доверие
Платный порноканал с участием школьников обнаружила прокуратура Туркестанской области
Население стран Восточной Европы стремительно сокращается - ООН
Пятибалльное землетрясение произошло на юге Казахстана
МВД обратилось к владельцам мопедов
Актау: Перспективы развития и превращение в крупный туристический центр Казахстана
Овечкин вплотную приблизился к «вечному» рекорду Гретцки
В МСХ – новое назначение
Цех с суррогатным алкоголем выявили в Костанайской области
Көрісу – день радости, встреч и прощения
Көрісу: Праздник весны, прощения и уважения в Казахстане
На участке «Болашак» в Мангистауской области будут добывать нефть
На ремонт Дворца культуры в Атырау потратят почти миллиард тенге
Падёж скота произошёл в Актюбинской области
Путь творчества – путь новаторства
Астанчане получили национальное оповещение на телефон: что случилось
Главу Центра судебных экспертиз арестовали по подозрению в хищении 2 млрд тенге
Госсекретарь США потребовал извинений от Зеленского
Переговоры США и Украины провалились
Точкой роста должен стать туризм
Мощный циклон угрожает Австралии
Современному Казахстану – поколение «лидеров служения»
Трамп может вывести американские войска из Германии
Фильм о Туркестане снимет турецкая компания
Спасибо вам за подвиг!

Читайте также

Конструктивное взаимодействие – залог успешного развития ст…
На повестке дня – поддержка инноваций
Тенденции образования будущего
Легпром легок на подъем

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]