(Не)хитрые алгоритмы

3032
Наталия Хомс

Легко ли обучить машину?

Всего 5 лет назад Ануар Аймолдин окончил факультет вычислительной математики и кибернетики МГУ, после – Школу анализа данных Яндекса. Теперь же он руководит командой Искусственного интеллекта (ИИ) в компании BTS Digital и шутит, что опроверг студенческий стереотип «выходя на работу, нужно забыть все, чему учили в университете». Напротив, вузовские знания более чем пригодились на практике, а работа по профессии – только в удовольствие.

– Моя область – машинное обучение. Мне нравится, что она лежит на пересечении программирования и математики. Это как раз моя специальность и мое хобби. Придает мотивации и то, что получается применять на практике знания, полученные в университете. Повезло, что мы живем в XXI столетии, веке информационных и цифровых технологий. Такое время, когда практически все университетские курсы по математике и программированию оказались зачем-то нужны, – рассказал Ануар.

Команда работает по 3 направлениям: анализ текста, изображений и звуковых данных. В штате 15 человек.

На вопрос о том, что же такое машинное обучение, Ануар привел в пример программы Speech to Text и Text to Speech – когда машина переводит голосовые данные в текст и наоборот. На этом принципе, например, работают голосовые помощники: Siri, Alexa, Google Assistant, Яндекс Алиса. Обработкой и составлением кода для машины, конечно же, занимается человек, который подготавливает данные и «обучает» машину их понимать и преобразовывать.

Людей, занимающихся написанием таких программ, называют Data Scientist (в переводе с англ. –исследователь или аналитик данных). Эта профессия появилась совсем недавно, но уже стала одной из самых востребованных в мире.

Существуют различные платформы, где регулярно проходят соревнования по анализу данных и машинному обучению. Любой желающий из любой точки мира – студент, аналитик, инженер или доктор наук – может зарегистрироваться и посоревноваться с другими. У каждого конкурса свой призовой фонд. От его размера, конечно, зачастую зависит число участников, но в большинстве своем в таких конкурсах принимают участие не ради денег, а ради особенного соревновательного духа и интересного опыта.


Увлекательные процессы

Недавно Ануар Аймолдин победил в соревновании на площадке Kaggle, которая принадлежит компании Google и является одной из самых престижных и известных в мире.

– Я уже принимал участие в этих соревнованиях и даже выиг­рывал в команде 2 золотые и 5 серебряных медалей. Однако абсолютная победа, да еще и в одиночку – впервые. Такое достижение на этой площадке особенно ценится, так как у Kaggle есть свой рейтинг, куда входит более миллиона зарегистрированных участников со всего мира. Благодаря этой победе я получил внушительный денежный приз и поднялся на 14-е место в рейтинге среди всех пользователей, – поделился успехами Ануар.

На Kaggle приходят организации со своими предложения­ми, проектами, конкурсами, предоставляют данные и ставят разработчикам определенные задачи. Один конкурс – это 2–3 месяца напряженной работы, так как программа должна все просчитать, требуются постоянные корректировки в вычислениях.

Организатором соревнования, в котором победил Ануар, выс­тупила Ассоциация визуальной информатики в медицине (Society for Imaging Informatics in Medicine), базирующаяся в Техасе. Участникам было дано задание построить компьютерную программу, которая сможет по рентгеновскому снимку определить, есть ли у человека пневмоторакс, и обнаружить его, чтобы в дальнейшем произвести оперативное вмешательство.

Пневмоторакс – это скопление воздуха в плевральной полости вследствие повреждения легкого или стенки грудной клетки. Он доставляет большие неудобства и боль при дыхании, легкое практически не раскрывается. Между тем человеческому взгляду тяжело сходу на снимке определить месторасположение и вообще наличие пневмоторакса.

– Процесс разработки таких программ комплексный. Очень важен этап сбора и подготовки данных. Потом пишется код, в котором заложена математичес­кая модель, и выполняется на компьютере. Обычно алгоритм долго «учится», анализируя предоставленные данные. Мы ставим различные эксперименты, чтобы нейронная сеть правильно научилась выполнять свою задачу. Роль человека тоже большая, ведь существуют разные приемы и трюки, которые очень зависят от кругозора, «смекалочки» и интуиции инженера, – рассказал Ануар Аймолдин.

Алгоритм работает на искусственных нейронных сетях: сначала ему подается много примеров, где врач верным образом разметил на рентгеновском снимке облас­ти пневмоторакса. Это также могут быть снимки здорового человека, где ничего не отмечено.

– Таких картинок было «скорм­лено» алгоритму порядка 10 тысяч. Плюс около 20 тысяч неразмеченных врачами – чтобы сам алгоритм «учился» их находить. Специалисты как раз это и называют процессом обучения. Компьютер, как маленький ребенок, много смотрит на картинки и со временем начинает обучаться и улавливать нужные закономерности. Основан алгоритм на специальных математических моделях для изображений – сверточных нейронных сетях, – пояснил Ануар.

В самом соревновании участвовало 1 500 команд, среди них ведущие медицинские организации, лаборатории, энтузиасты, студенты. При этом для Казахстана оно оказалось одним из самых успешных: медали различного достоинства получили сразу нес­колько представителей нашей страны, в том числе и студенты Казахстанского филиала МГУ и Назарбаев Университета.

А что же дальше? Пока есть только алгоритм, но его еще нужно «положить в коробочку», то есть внедрить. А этот процесс в медицине, как правило, требует множества проверок. Все должно быть точно выверено, потому что на кону здоровье людей.

– Здорово, что ты можешь приносить пользу людям и облегчить жизнь медицинским работникам, не разбираясь в тонкостях медицины на таком же уровне. Конечно, это не отменяет того, что требуется полное погружение в отрасль. Мы с партнерами уже начинаем двигаться в этом направлении, хотелось бы налаживать связи с врачами и медцент­рами для внедрения сис­темы, – поделился Ануар.

Еще в планах у молодого разработчика открыть компанию, работающую в области искусственного интеллекта. Это позволит извлечь из новых технологий непосредственную пользу в виде повышения качества жизни населения, представить их реальную ценность для бизнеса и открыть дополнительные рабочие места для технических специалистов, студентов IT-специальностей.

В Казахстане эта индустрия активно развивается. Ануару с друзьями в социальной сети удалось создать целое сообщест­во энтузиастов машинного обучения, где общаются более 2 тыс. человек. В крупнейших городах регулярно организуются открытые мероприятия, где более опытные специалисты делятся своими знаниями. Новичкам всегда рады, им подсказывают, какие материалы надо освоить, чтобы совершать магию в мире компьютерных кодов. Так что, «ненейронная сеть» казахстанских разработчиков в области анализа данных и искусственного интеллекта развивается, «обучается» и растет.

Популярное

Все
Стипендии повысили студентам в Казахстане
SMS-коды 1414 больше не используются в Казахстане
В тройке лидеров
Автоледи получила 1 год лишения свободы за нетрезвую езду в Конаеве
Охотничьи испытания казахского тазы провели в Алматинской области
В столице в честь Дня Независимости пройдет республиканская ярмарка ремесел
В Бенине военные захватили власть
Костанайские предприниматели просят отложить запрет на эксплуатацию трехосных самосвалов на 3 года
Избран новый президент Федерации борьбы Казахстана
Жители села Шамши Калдаякова активно участвуют в преобразованиях
Мечта, ставшая реальностью благодаря Президенту Касым-Жомарту Токаеву
Президент Ирана прибыл в Акорду
Водителя груженого бензовоза заподозрили в нетрезвом вождении
Нацбанк предупредил казахстанцев о новой схеме мошенничества
«Адал азамат»: внимание к каждому ученику
Мы третьи в мире!
Итоги большого общественного пути
Когда призраки прошлого оживают в семейном доме
Фигуристка Самоделкина завоевала «бронзу» на турнире в Хорватии
Месси установил новый рекорд по числу трофеев в футболе
Началось строительство сталелитейного завода
В армию со своей гитарой: история талантливого солдата
Какой будет зима в Казахстане, рассказали синоптики
Новые авто вручили гвардейцам в Караганде
«Закон и порядок»: уроки цифровой грамотности организовали для столичных студентов
Тестирование по Qaztest провели в командовании Нацгвардии
Из казармы в кампус
Ключевой ориентир – человекоцентричность
«Райская птица» зацвела в Северном Казахстане
Политика здравого смысла
Устроившие погром на остановке нарушители получили по 10 суток ареста в Астане
В Нацгвардии запустили курс подготовки операторов БПЛА
Сильнейшие бадминтонисты мира соберутся в Астане
Полицейские с помощью дрона зафиксировали грубое нарушение на трассе в Акмолинской области
Зима будет теплой
Школьники из Семея изготовили EcoBox из пластиковых крышек
Талгар будет расти и вширь, и ввысь
Уверенный рост экономики Приаралья
Метель, туман, гололед: 20-градусные морозы надвигаются на Казахстан
По следам Великого шелкового пути: как провести отпуск в Узбекистане

Читайте также

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]