ISSAI NU представил KAZ-LLM – казахскую большую языковую модель

2011
Кадиша Ныгмет

Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили Главе государства ­Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT.

фото пресс-службы NU

Применение KAZ-LLM повсеместно – от переводов и генерации контента до обработки объемных текстов. Адаптированная к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым относится казахский.

Команда ISSAI собрала, обработала, синтезировала и перевела более 150 миллиардов токенов (т. е. слов и подслов), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

Помимо этого, ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области ИИ. Казахстанские исследователи участ­вовали во всех этапах процесса – от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

Проект был начат в апреле этого года. Тренировка модели заняла у разработчиков около пяти месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

– Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологи­ческой экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках, – рассказал директор ISSAI профессор NU Хусейн Атакан Варол.

ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширение этих моделей для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и значительное экономическое и технологическое влияние в Казахстане и за его пределами.

Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline). Разработка велась независимо от государственного финансирования.

Популярное

Все
Будущее – за цифровыми активами
Турнир Большого шлема в Астане
Известному политическому деятелю, журналисту, политологу Куанышу Султанову исполнилось 80 лет
Управление популяцией сайги следует начать с обводнения естественных ареалов ее обитания
Участники марафона-байги «Ұлы дала жорығы» преодолели половину пути
На страже здоровья – искусственный интеллект
Он был настоящим...
Национальные виды спорта: традиции и современность
Творческая академия зажигает звездочек
На Уральской ТЭЦ запущена новая турбина
Угнал велосипед и  поплатился
Туриндустрия: нужен научный подход
Быть или не быть в элите?
Вечно живые
Стартовала Неделя репродуктивного здоровья
Попуски завершены – пойма затоплена
Указ Президента Республики Казахстан О награждении
Закон Республики Казахстан О ратификации Соглашения между Правительством Республики Казахстан и Правительством Объединенных Арабских Эмиратов о реализации проекта ветровой электростанции
Погодные условия пока благоприятны
Чтобы земля работала
Строительство десяти крупных заводов по производству хлопка начали в Туркестанской области
Костанайская область – лидер РК по производству и экспорту продуктов питания
Служебные собаки Нацгвардии отличились на международной выставке
Три перекрестка временно закроют на ремонт в Астане
Дорога Атырау-Астрахань: завершающий этап
Авиакомпания Qazaq Air официально меняет название
Свыше 4 тыс. военнослужащих приняли участие в военном параде в честь 80-летия Великой Победы
Опубликован полный текст выступления Главы государства на военном параде в Астане
NASA подтвердило предсказание Стивена Хокинга о конце света
Бессмертный подвиг девушки-снайпера
«Ұлы дала жорығы»: 80-летию Великой Победы посвящается
Профессионал, с которым повезло работать
7 мая — день силы и чести: Казахстан отмечает День защитника Отечества
Человек-легенда
В Алматы торжественно открыли музей военной техники
В Минобороны обратились к казахстанцам
Птица счастья: клип башкирской группы Ay Yola оценили в Казнете
Ветераны Мангистау примут участие в военном параде в Астане
Страховая медицина: вопросы без ответов
Стартовал первый в республике лесоклиматический проект
Акимат Алматинской области ответил на жалобу автомобилистов
В Талдыкоргане 15 человек уже год ждут купленные «по предзаказу» телефоны
Ответственность за «овербукинг» вводят в Казахстане
Личный состав Нацгвардии перешел на летнюю форму одежды
В Казахстане стартовало профилактическое мероприятие «Безопасная дорога»
Акмолинец выехал на встречную полосу прямо перед полицейскими
В лицее Шымкента хотели закупить 45 тысяч пачек бумаги на 90 млн тенге
Начато возведение крупного металлургического завода
Почему огородик в Шымкенте стал дороже сайрамского гектара?
Полководец. Писатель. Патриот
Незнание законов не освобождает от... профессии
Продвижение казахского языка и культуры обсудил Президент с главой «Яндекс Global»
Прокуроры на фронте и в тылу – на страже закона и порядка
Как убивали Шерзата Болата
Астана становится центром ивент-туризма
Нет дружбы крепче фронтовой
Говорят правнуки солдат Победы
Граждан Китая вызволили из солончаковой западни в Костанайской области
Украина и США подписали меморандум к соглашению о полезных ископаемых
Закон Республики Казахстан О внесении изменений и дополнений в некоторые законодательные акты Республики Казахстан по вопросам физической культуры и спорта, а также исключения излишней законодательной регламентации

Читайте также

Защитить лес от пожара
Казахстан – ОАЭ: нацеленность на долгосрочное партнерство
В расчете на мощный мультипликативный эффект
Главный человек в каждой судьбе

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]