(Не)хитрые алгоритмы

2983
Наталия Хомс

Легко ли обучить машину?

Всего 5 лет назад Ануар Аймолдин окончил факультет вычислительной математики и кибернетики МГУ, после – Школу анализа данных Яндекса. Теперь же он руководит командой Искусственного интеллекта (ИИ) в компании BTS Digital и шутит, что опроверг студенческий стереотип «выходя на работу, нужно забыть все, чему учили в университете». Напротив, вузовские знания более чем пригодились на практике, а работа по профессии – только в удовольствие.

– Моя область – машинное обучение. Мне нравится, что она лежит на пересечении программирования и математики. Это как раз моя специальность и мое хобби. Придает мотивации и то, что получается применять на практике знания, полученные в университете. Повезло, что мы живем в XXI столетии, веке информационных и цифровых технологий. Такое время, когда практически все университетские курсы по математике и программированию оказались зачем-то нужны, – рассказал Ануар.

Команда работает по 3 направлениям: анализ текста, изображений и звуковых данных. В штате 15 человек.

На вопрос о том, что же такое машинное обучение, Ануар привел в пример программы Speech to Text и Text to Speech – когда машина переводит голосовые данные в текст и наоборот. На этом принципе, например, работают голосовые помощники: Siri, Alexa, Google Assistant, Яндекс Алиса. Обработкой и составлением кода для машины, конечно же, занимается человек, который подготавливает данные и «обучает» машину их понимать и преобразовывать.

Людей, занимающихся написанием таких программ, называют Data Scientist (в переводе с англ. –исследователь или аналитик данных). Эта профессия появилась совсем недавно, но уже стала одной из самых востребованных в мире.

Существуют различные платформы, где регулярно проходят соревнования по анализу данных и машинному обучению. Любой желающий из любой точки мира – студент, аналитик, инженер или доктор наук – может зарегистрироваться и посоревноваться с другими. У каждого конкурса свой призовой фонд. От его размера, конечно, зачастую зависит число участников, но в большинстве своем в таких конкурсах принимают участие не ради денег, а ради особенного соревновательного духа и интересного опыта.


Увлекательные процессы

Недавно Ануар Аймолдин победил в соревновании на площадке Kaggle, которая принадлежит компании Google и является одной из самых престижных и известных в мире.

– Я уже принимал участие в этих соревнованиях и даже выиг­рывал в команде 2 золотые и 5 серебряных медалей. Однако абсолютная победа, да еще и в одиночку – впервые. Такое достижение на этой площадке особенно ценится, так как у Kaggle есть свой рейтинг, куда входит более миллиона зарегистрированных участников со всего мира. Благодаря этой победе я получил внушительный денежный приз и поднялся на 14-е место в рейтинге среди всех пользователей, – поделился успехами Ануар.

На Kaggle приходят организации со своими предложения­ми, проектами, конкурсами, предоставляют данные и ставят разработчикам определенные задачи. Один конкурс – это 2–3 месяца напряженной работы, так как программа должна все просчитать, требуются постоянные корректировки в вычислениях.

Организатором соревнования, в котором победил Ануар, выс­тупила Ассоциация визуальной информатики в медицине (Society for Imaging Informatics in Medicine), базирующаяся в Техасе. Участникам было дано задание построить компьютерную программу, которая сможет по рентгеновскому снимку определить, есть ли у человека пневмоторакс, и обнаружить его, чтобы в дальнейшем произвести оперативное вмешательство.

Пневмоторакс – это скопление воздуха в плевральной полости вследствие повреждения легкого или стенки грудной клетки. Он доставляет большие неудобства и боль при дыхании, легкое практически не раскрывается. Между тем человеческому взгляду тяжело сходу на снимке определить месторасположение и вообще наличие пневмоторакса.

– Процесс разработки таких программ комплексный. Очень важен этап сбора и подготовки данных. Потом пишется код, в котором заложена математичес­кая модель, и выполняется на компьютере. Обычно алгоритм долго «учится», анализируя предоставленные данные. Мы ставим различные эксперименты, чтобы нейронная сеть правильно научилась выполнять свою задачу. Роль человека тоже большая, ведь существуют разные приемы и трюки, которые очень зависят от кругозора, «смекалочки» и интуиции инженера, – рассказал Ануар Аймолдин.

Алгоритм работает на искусственных нейронных сетях: сначала ему подается много примеров, где врач верным образом разметил на рентгеновском снимке облас­ти пневмоторакса. Это также могут быть снимки здорового человека, где ничего не отмечено.

– Таких картинок было «скорм­лено» алгоритму порядка 10 тысяч. Плюс около 20 тысяч неразмеченных врачами – чтобы сам алгоритм «учился» их находить. Специалисты как раз это и называют процессом обучения. Компьютер, как маленький ребенок, много смотрит на картинки и со временем начинает обучаться и улавливать нужные закономерности. Основан алгоритм на специальных математических моделях для изображений – сверточных нейронных сетях, – пояснил Ануар.

В самом соревновании участвовало 1 500 команд, среди них ведущие медицинские организации, лаборатории, энтузиасты, студенты. При этом для Казахстана оно оказалось одним из самых успешных: медали различного достоинства получили сразу нес­колько представителей нашей страны, в том числе и студенты Казахстанского филиала МГУ и Назарбаев Университета.

А что же дальше? Пока есть только алгоритм, но его еще нужно «положить в коробочку», то есть внедрить. А этот процесс в медицине, как правило, требует множества проверок. Все должно быть точно выверено, потому что на кону здоровье людей.

– Здорово, что ты можешь приносить пользу людям и облегчить жизнь медицинским работникам, не разбираясь в тонкостях медицины на таком же уровне. Конечно, это не отменяет того, что требуется полное погружение в отрасль. Мы с партнерами уже начинаем двигаться в этом направлении, хотелось бы налаживать связи с врачами и медцент­рами для внедрения сис­темы, – поделился Ануар.

Еще в планах у молодого разработчика открыть компанию, работающую в области искусственного интеллекта. Это позволит извлечь из новых технологий непосредственную пользу в виде повышения качества жизни населения, представить их реальную ценность для бизнеса и открыть дополнительные рабочие места для технических специалистов, студентов IT-специальностей.

В Казахстане эта индустрия активно развивается. Ануару с друзьями в социальной сети удалось создать целое сообщест­во энтузиастов машинного обучения, где общаются более 2 тыс. человек. В крупнейших городах регулярно организуются открытые мероприятия, где более опытные специалисты делятся своими знаниями. Новичкам всегда рады, им подсказывают, какие материалы надо освоить, чтобы совершать магию в мире компьютерных кодов. Так что, «ненейронная сеть» казахстанских разработчиков в области анализа данных и искусственного интеллекта развивается, «обучается» и растет.

Популярное

Все
Не потерять доверие аудитории в эпоху ИИ
На пути к технологической независимости
Банковская «тайна»: повышение конкуренции и упрощение доступа
Во главе угла – безопасность детей
Аудит как стратегическая инвестиция
Когда отечественная наука даст конкретный результат?
Имеется потенциал в развитии транспортных коридоров
Совместный ответ на вызовы
Новобранцы пополнили войска
Отрасль, где гостеприимство – фактор успеха
Гвардеец завоевал золото на чемпионате Евразии по пауэрлифтингу
Сюрприз на сцене: гвардейцы приготовили для родителей трогательный подарок
Президент Финляндии провел лекцию в Maqsut Narikbayev University
«Ход королевы»: Почему женщины из Казахстана успешнее в шахматах, чем мужчины?
Казахстан остается надежным партнером США в условиях новой мировой экономики
«Цифра» на вооружении районной полиции
Ержан Бабакумаров убит в Астане
Технический колледж: практика и трудоустройство
Беспорядки в Танзании: сообщается о сотнях погибших
За знаниями – в новые школы
Итоги открытого Кубка Президента РК
Новая казахстанская AI-платформа превращает ИИ в инструмент для бизнеса
Университеты должны стать "фабрикой будущего"
Елена Рыбакина попала в группу Серены Уильямс
Театр имени Наталии Сац с триумфом отмечает юбилей
Стерильно, автономно, бесперебойно
Вкус апорта в осеннем парке
Не инвесторы, а строители финпирамид
Зоозащитники предлагают
Пенсионерам вход бесплатный
Международный день анимации: гвардеец создал военный мультфильм
Гвардейцы — призёры Открытого Кубка Азии по дзюдо в Актау
Военнослужащие Нацгвардии стали призёрами Кубка мира
Завершена реконструкция Центрального стадиона
В Казахстане станет сложнее пользоваться банкоматами
Пожар в столичном кафе: ремонт в пострадавших квартирах завершен на 90%
Опасность в тарелке: в СКО зарегистрировали 19 случаев описторхоза
В Шымкенте открыли 14 социальных павильонов
Главнокомандующий Нацгвардией провел приём граждан
Алматинская область вновь побила рекорд посещаемости
Лювак для бодрости
Жители Усть-Каменогорска построили мост методом асар
Рыбоперерабатывающий завод запустили в Кызылординской области
Новую школу на 1 200 мест открыли в ЗКО
Краснокнижного зверька засняли на видео в Алматинской области
Зампред КНБ отправлен в отставку
За пловом и природой – в Таджикистан
В Таразе продолжается обновление парка городских автобусов
«Жассарбаз»: прикоснуться к небу

Читайте также

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]