ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

2695
Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
Зажжен огонь зимних Игр
Увидеть вечное в простом
Кубок мира-2026 от World Boxing
Общие страницы истории
О качестве и количестве военных кафедр
Воспитание защитника Отечества
Различают только по погонам
Книги объединяют народы
Стартует первый падел-тур
Что едят наши дети?
Путь к лидерству и финансовой стабильности
Новое достижение Дастана Сатпаева
В основе успеха – кооперация науки и производства
АСП: усилен контроль
Зоркий взгляд и острый ум
Изучать язык, культуру и традиции через музыку
Летописцы эпохи
Новая экономическая политика и экспорт
По принципу целевого финансирования
Закон Республики Казахстан О ратификации Соглашения
Началось строительство сталелитейного завода
Новые авто вручили гвардейцам в Караганде
Какой будет зима в Казахстане, рассказали синоптики
Из казармы в кампус
Политика здравого смысла
Полицейские с помощью дрона зафиксировали грубое нарушение на трассе в Акмолинской области
Талгар будет расти и вширь, и ввысь
Гвардейцам вручили ещё 400 сертификатов в ВУЗы
Ушла из жизни казахстанская тележурналистка Диля Ибрагимова
Устроившие погром на остановке нарушители получили по 10 суток ареста в Астане
Опасное погружение и обманутые судьбы: есть ли дорога назад?
Новая услуга стала доступна в приложении «ЦОН»
Новый центр мировой металлургии
В Шымкенте открыт молодежный хаб
Метростроевцы ускоряют темп
Сильнейшие бадминтонисты мира соберутся в Астане
Мы строим энергетику нового поколения, отвечающую вызовам времени
В области Жетысу прошел инвестиционный форум
Будущее судебной экспертизы в эпоху ИИ
Наращивая транзитный потенциал страны
Сюрприз на сцене: гвардейцы приготовили для родителей трогательный подарок
Отрасль, где гостеприимство – фактор успеха
Гвардеец завоевал золото на чемпионате Евразии по пауэрлифтингу
Тестирование по Qaztest провели в командовании Нацгвардии
Ошибка, которую нужно исправить: мажилисмен о запрете самосвалов на автодорогах
Кайрат» продолжает удивлять Европу и нас
Все строго по правилам
В Нацгвардии запустили курс подготовки операторов БПЛА
Мегапроект Саудовской Аравии «Зеркальная линия» – на грани провала
Зима будет теплой
«Закон и порядок»: уроки цифровой грамотности организовали для столичных студентов
Школьники из Семея изготовили EcoBox из пластиковых крышек
«Ход королевы»: Почему женщины из Казахстана успешнее в шахматах, чем мужчины?
Режут провода, портят светильники: Шымкент страдает от вандалов
Уверенный рост экономики Приаралья
Метель, туман, гололед: 20-градусные морозы надвигаются на Казахстан
Президент Финляндии провел лекцию в Maqsut Narikbayev University
По следам Великого шелкового пути: как провести отпуск в Узбекистане
Запущен завод по переработке мяса птицы
На 50 млн тенге оштрафованы предприниматели за необоснованные цены

Читайте также

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]