Ученые разработали базу по цифровизации государственного языка

Қазақ тілі
15
Галия Шимырбаева
корреспондент Алматинского корпункта

Казахстанские ученые-лингвисты создали Национальный корпус казахского языка -  цифровую базу выверенных текстов государственного языка (qazcorpus.kz), сообщает  Kazpravda.kz📌

И сегодня благодаря этому многие мировые искусственные интеллекты высокого уровня (такие, например, как ChatGPT) грамотно владеют казахским языком. Теперь перед отечественными лингвистами стоит задача по разработке собственного искусственного интеллекта на основе LLM - Large Linguistic Model. Простыми словами,  это мозг искусственного интеллекта.

По словам директора Института языкознания им.Ахмета Байтурсынова Анар Фазылжановой, возглавляемое ею учреждение совместно с научными центрами КазГУ им аль-Фараби, "ННПЦ "Тіл-Қазына", Института вычислительных технологий и Назарбаев-университета разрабатывает большую языковую модель для создания собственного искусственного интеллекта в соответствии с особенностями казахского языка и культуры.

- Например,  мы раскрываем глубинную семантику казахских пословиц, поговорок, устойчивых словосочетаний и фразеологизмов, которые скрыты от простого носителя языка, - сообщила она.

 

#цифровизация #язык

