(Не)хитрые алгоритмы

3031
Наталия Хомс

Легко ли обучить машину?

Всего 5 лет назад Ануар Аймолдин окончил факультет вычислительной математики и кибернетики МГУ, после – Школу анализа данных Яндекса. Теперь же он руководит командой Искусственного интеллекта (ИИ) в компании BTS Digital и шутит, что опроверг студенческий стереотип «выходя на работу, нужно забыть все, чему учили в университете». Напротив, вузовские знания более чем пригодились на практике, а работа по профессии – только в удовольствие.

– Моя область – машинное обучение. Мне нравится, что она лежит на пересечении программирования и математики. Это как раз моя специальность и мое хобби. Придает мотивации и то, что получается применять на практике знания, полученные в университете. Повезло, что мы живем в XXI столетии, веке информационных и цифровых технологий. Такое время, когда практически все университетские курсы по математике и программированию оказались зачем-то нужны, – рассказал Ануар.

Команда работает по 3 направлениям: анализ текста, изображений и звуковых данных. В штате 15 человек.

На вопрос о том, что же такое машинное обучение, Ануар привел в пример программы Speech to Text и Text to Speech – когда машина переводит голосовые данные в текст и наоборот. На этом принципе, например, работают голосовые помощники: Siri, Alexa, Google Assistant, Яндекс Алиса. Обработкой и составлением кода для машины, конечно же, занимается человек, который подготавливает данные и «обучает» машину их понимать и преобразовывать.

Людей, занимающихся написанием таких программ, называют Data Scientist (в переводе с англ. –исследователь или аналитик данных). Эта профессия появилась совсем недавно, но уже стала одной из самых востребованных в мире.

Существуют различные платформы, где регулярно проходят соревнования по анализу данных и машинному обучению. Любой желающий из любой точки мира – студент, аналитик, инженер или доктор наук – может зарегистрироваться и посоревноваться с другими. У каждого конкурса свой призовой фонд. От его размера, конечно, зачастую зависит число участников, но в большинстве своем в таких конкурсах принимают участие не ради денег, а ради особенного соревновательного духа и интересного опыта.


Увлекательные процессы

Недавно Ануар Аймолдин победил в соревновании на площадке Kaggle, которая принадлежит компании Google и является одной из самых престижных и известных в мире.

– Я уже принимал участие в этих соревнованиях и даже выиг­рывал в команде 2 золотые и 5 серебряных медалей. Однако абсолютная победа, да еще и в одиночку – впервые. Такое достижение на этой площадке особенно ценится, так как у Kaggle есть свой рейтинг, куда входит более миллиона зарегистрированных участников со всего мира. Благодаря этой победе я получил внушительный денежный приз и поднялся на 14-е место в рейтинге среди всех пользователей, – поделился успехами Ануар.

На Kaggle приходят организации со своими предложения­ми, проектами, конкурсами, предоставляют данные и ставят разработчикам определенные задачи. Один конкурс – это 2–3 месяца напряженной работы, так как программа должна все просчитать, требуются постоянные корректировки в вычислениях.

Организатором соревнования, в котором победил Ануар, выс­тупила Ассоциация визуальной информатики в медицине (Society for Imaging Informatics in Medicine), базирующаяся в Техасе. Участникам было дано задание построить компьютерную программу, которая сможет по рентгеновскому снимку определить, есть ли у человека пневмоторакс, и обнаружить его, чтобы в дальнейшем произвести оперативное вмешательство.

Пневмоторакс – это скопление воздуха в плевральной полости вследствие повреждения легкого или стенки грудной клетки. Он доставляет большие неудобства и боль при дыхании, легкое практически не раскрывается. Между тем человеческому взгляду тяжело сходу на снимке определить месторасположение и вообще наличие пневмоторакса.

– Процесс разработки таких программ комплексный. Очень важен этап сбора и подготовки данных. Потом пишется код, в котором заложена математичес­кая модель, и выполняется на компьютере. Обычно алгоритм долго «учится», анализируя предоставленные данные. Мы ставим различные эксперименты, чтобы нейронная сеть правильно научилась выполнять свою задачу. Роль человека тоже большая, ведь существуют разные приемы и трюки, которые очень зависят от кругозора, «смекалочки» и интуиции инженера, – рассказал Ануар Аймолдин.

Алгоритм работает на искусственных нейронных сетях: сначала ему подается много примеров, где врач верным образом разметил на рентгеновском снимке облас­ти пневмоторакса. Это также могут быть снимки здорового человека, где ничего не отмечено.

– Таких картинок было «скорм­лено» алгоритму порядка 10 тысяч. Плюс около 20 тысяч неразмеченных врачами – чтобы сам алгоритм «учился» их находить. Специалисты как раз это и называют процессом обучения. Компьютер, как маленький ребенок, много смотрит на картинки и со временем начинает обучаться и улавливать нужные закономерности. Основан алгоритм на специальных математических моделях для изображений – сверточных нейронных сетях, – пояснил Ануар.

В самом соревновании участвовало 1 500 команд, среди них ведущие медицинские организации, лаборатории, энтузиасты, студенты. При этом для Казахстана оно оказалось одним из самых успешных: медали различного достоинства получили сразу нес­колько представителей нашей страны, в том числе и студенты Казахстанского филиала МГУ и Назарбаев Университета.

А что же дальше? Пока есть только алгоритм, но его еще нужно «положить в коробочку», то есть внедрить. А этот процесс в медицине, как правило, требует множества проверок. Все должно быть точно выверено, потому что на кону здоровье людей.

– Здорово, что ты можешь приносить пользу людям и облегчить жизнь медицинским работникам, не разбираясь в тонкостях медицины на таком же уровне. Конечно, это не отменяет того, что требуется полное погружение в отрасль. Мы с партнерами уже начинаем двигаться в этом направлении, хотелось бы налаживать связи с врачами и медцент­рами для внедрения сис­темы, – поделился Ануар.

Еще в планах у молодого разработчика открыть компанию, работающую в области искусственного интеллекта. Это позволит извлечь из новых технологий непосредственную пользу в виде повышения качества жизни населения, представить их реальную ценность для бизнеса и открыть дополнительные рабочие места для технических специалистов, студентов IT-специальностей.

В Казахстане эта индустрия активно развивается. Ануару с друзьями в социальной сети удалось создать целое сообщест­во энтузиастов машинного обучения, где общаются более 2 тыс. человек. В крупнейших городах регулярно организуются открытые мероприятия, где более опытные специалисты делятся своими знаниями. Новичкам всегда рады, им подсказывают, какие материалы надо освоить, чтобы совершать магию в мире компьютерных кодов. Так что, «ненейронная сеть» казахстанских разработчиков в области анализа данных и искусственного интеллекта развивается, «обучается» и растет.

Популярное

Все
Осечка на старте
Понять Абая сердцем
Разрушить барьеры молчания
Патриарх философской науки Казахстана
Мы третьи в мире!
Некоторые мысли к юбилею
Когда один двор меняет целый мир
Танцы без границ
Наставник – звучит гордо
Прорыв в будущее
Секреты мастеров
В армию со своей гитарой: история талантливого солдата
Ключевой ориентир – человекоцентричность
«Райская птица» зацвела в Северном Казахстане
В ВКО фотоловушки сняли галерею «портретов» обитателей тайги
Завершена реконструкция автодороги Кызылорда – Жезказган
О погоде в Казахстане на ближайшие три дня сообщили синоптики
Как лечить ОРВИ и грипп у детей: столичный врач обратилась к родителям
В Алматинской области найдена галерея петроглифов
Партию «запрещёнки» пытались доставить в уральскую колонию
Водитель из Талдыкоргана установил шокирующий антирекорд по ПДД
Новая аграрная политика Токаева меняет правила игры для бизнеса на селе
Стартовал отбор в элиту Нацгвардии
Инструмент противодействия манипуляциям и фейкам
Индустриальную зону создают в Сатпаеве
Первую красавицу Казахстана выбрали в Алматы
Не только помощь, но и образ жизни
Экономика Жамбылской области вошла в топ-3 по республике
Жанибека Алимханулы лишили боя за три титула: WBO сделала заявление
Добро без громких лозунгов и камер
Европейский Союз и Казахстан: Превращая общие вызовы в общие возможности
Началось строительство сталелитейного завода
Какой будет зима в Казахстане, рассказали синоптики
Новые авто вручили гвардейцам в Караганде
Тестирование по Qaztest провели в командовании Нацгвардии
Ошибка, которую нужно исправить: мажилисмен о запрете самосвалов на автодорогах
Из казармы в кампус
«Закон и порядок»: уроки цифровой грамотности организовали для столичных студентов
Политика здравого смысла
Все строго по правилам
В Нацгвардии запустили курс подготовки операторов БПЛА
Мегапроект Саудовской Аравии «Зеркальная линия» – на грани провала
Полицейские с помощью дрона зафиксировали грубое нарушение на трассе в Акмолинской области
Зима будет теплой
Школьники из Семея изготовили EcoBox из пластиковых крышек
Устроившие погром на остановке нарушители получили по 10 суток ареста в Астане
Талгар будет расти и вширь, и ввысь
Режут провода, портят светильники: Шымкент страдает от вандалов
Уверенный рост экономики Приаралья
Метель, туман, гололед: 20-градусные морозы надвигаются на Казахстан
Сильнейшие бадминтонисты мира соберутся в Астане

Читайте также

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]