ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

2470
Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
ИИ приходит в школу
Вопреки капризам природы
Жатва на юге вышла на финишную прямую
Министр проверил боеготовность и условия службы в гарнизоне
Технологии для удобства жизни
Завтра – День работников нефтегазового комплекса
Решить квартирный вопрос
АНПЗ – 80 лет: путь славы и ответственности
Риски радикализации внешнеполитических подходов
Как сбылась мечта Мауыты-әже
Энергетике и ЖКХ нужны «длинные деньги»
Сфера, сыгравшая особую роль в развитии страны
Жемчужина национального искусства
Есть шанс начать новую жизнь
Распоряжение Председателя Мажилиса Парламента Республики Казахстан
Синдром 7 сентября
Преодолевая обстоятельства
Будущее глазами художников
Давайте будем позитивными!
Игра, которая запомнится
35 школ Атырауской области остались без директоров
Прокуратура на защите конституционных ценностей государства
Отслужил и получил грант: солдат из Нацгвардии стал студентом
Кубок Senat Open разыграли в Астане
В новом учебном году за парты сядут 360 тыс. первоклассников
Лидеры прибывают в Алматы
Завтра - День шахтера!
В Семее студента приговорили к пожизненному сроку
В общежитиях созданы комфортные условия
В краю шахтерском
AI-Sana в помощь студентам
Инвестор Топ-10 в экономику Казахстана
Глава государства прибыл в Китай на саммит ШОС
Основной закон не должен восприниматься как абстрактный текст, поскольку это живой документ
ШОС: Лидеры Казахстана и Китая провели переговоры в Тяньцзине
Глава государства рассказал о дружбе и партнерстве Казахстана и Китая
Конституция начинает говорить с гражданином на языке его проблем
Трамп отправил к берегам Венесуэлы военную флотилию
Касым-Жомарт Токаев: "Ряд новых положений Конституции не имеет прецедентов в мировой практике"
Бублик впервые вышел во вторую неделю US Open и встретится с Синнером
Гвардейцы поздравили жителей Кокшетау с Днем Конституции
Военнослужащие Нацгвардии провели акцию «Дорога в школу»
В Кызылординской области все больше сёл отказываются от продажи алкоголя
Незаконные постройки снесут в Уральске
Четыре человека погибли в жуткой аварии в Актюбинской области
Алматинская область подарила земле Абая скульптуру «Золотой человек»
Жители Шымкента не спешат платить
Модернизация на особом контроле
В Павлодаре откроют первую комфортную школу
Проезд сделали бесплатным
Аким Мангистау ознакомился с ходом строительства социальных объектов
Бектенов поручил внести предложения по наказанию виновных в срыве дорожных проектов
Госаудит проверил расходы казахстанской науки
Молодой парень утонул на озере Алаколь - ВИДЕО
День строителя
В Сарани строят завод по сборке грузовиков
Новую школу построят в Атырау
Требуются выпускники вузов для работы журналистами на сайте Kazpravda.kz
Aitu: в чем отличие казахстанского мессенджера от WhatsApp и Telegram
Ставки по вкладам физлиц в тенге обновили рекорд XXI века

Читайте также

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]