ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

2388
Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
В режиме открытого неба
Оставили без квартир и денег
В Астане соберутся библиотекари со всего мира
Школа имени Абая готовится к новоселью
Стартовали республиканские командно-штабные учения «Қалқан-2025»
Убирают хлеб, заготавливают корма
Растет спрос на газ
Качество и сроки выполнения работ под строгим контролем
Оступившимся помогает служба пробации
Где родился Конек-Горбунок
Отходы дешевле купить... за границей
Юридические консультанты: от семейных споров до судебных тяжб
Агрохимия на страже урожайности
Более 5 тыс. человек покинули свои дома из-за пожаров в Испании
Всегда на связи!
Минздрав призывает казахстанцев проходить ежегодные скрининги
Знак уважения молодым талантам
Колокольная симфония
Попались, красавчики!
Главный принцип – человекоцентричность
В Кызылординской области все больше сёл отказываются от продажи алкоголя
Незаконные постройки снесут в Уральске
Алматинская область подарила земле Абая скульптуру «Золотой человек»
Модернизация на особом контроле
В Павлодаре откроют первую комфортную школу
Молодой парень утонул на озере Алаколь - ВИДЕО
Всеобщее декларирование в Казахстане: кого оно касается и что изменилось?
День строителя
Джей Ло в Алматы: что важно знать перед концертом
Этнический казах из Франции представил в Париже парфюм Kiz Jibek
Министр проверил обеспечение аграриев поливной водой
Акчулаков доложил Президенту о работе и планах Ассоциации инвесторов
На побережье Алаколя появится оздоровительный комплекс
Путин рассказал Токаеву об итогах беседы со спецпосланником Президента США
Пять бронзовых медалей завоевали казахстанки на молодежном ЧА по боксу
Продолжается активная борьба с кибермошенничеством
Участников свадебного кортежа наказали в Туркестанской области
Шаг в развитии местной экономики
Новый Налоговый кодекс: как государство снижает административную нагрузку на бизнес
Опубликованы имена обладателей государственных образовательных грантов
В Караганде подорожает проезд в автобусе
До конца 2025 года в Казахстане введут обязательную маркировку моторных масел
Закон Республики Казахстан О внесении изменений и дополнений в Кодекс Республики Казахстан «О налогах и других обязательных платежах в бюджет» (Налоговый кодекс) и законы Республики Казахстан          по вопросам введения его в действие
Десять человек погибли за два дня на трассах Казахстана
На Зеленом базаре арендаторы в очередной раз устроили демарш
В Астане сгорел рынок «Big Шанхай»
Жезказган – Кызылорда: уложены первые километры асфальта
Асфальтобетонный завод строят в Сатпаеве
Сильные дожди накроют Казахстан
Амангельды Нугманов: Защита прав человека – ключевой ориентир в работе полиции
Сенатор Амангельды Нугманов ознакомился с инициативами в сфере высшего образования в Актобе
Сильные дожди сменят жару в Казахстане
Более полумиллиарда тенге выделили на ремонт столетней дороги в ВКО
Сенаторы обсудили с военными Жетысу реализацию закона о территориальной обороне
​​​​​​​Закон Республики Казахстан О внесении изменений и дополнений в некоторые законодательные акты Республики Казахстан по вопросам оптимизации уголовного законодательства Республики Казахстан
Сенатор Алибек Наутиев высказался о развитии рыбной промышленности в Атырауской области
В Павлодарской области масштабно отметили 125-летие Исы Байзакова
Родители потратили благотворительную помощь на лечение сына: возбуждено дело
Гвардеец завоевал бронзу на ЧМ по пляжному самбо в Сингапуре
О погоде в Казахстане на первые дни августа рассказали синоптики

Читайте также

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]