(Не)хитрые алгоритмы

3108
Наталия Хомс

Легко ли обучить машину?

Всего 5 лет назад Ануар Аймолдин окончил факультет вычислительной математики и кибернетики МГУ, после – Школу анализа данных Яндекса. Теперь же он руководит командой Искусственного интеллекта (ИИ) в компании BTS Digital и шутит, что опроверг студенческий стереотип «выходя на работу, нужно забыть все, чему учили в университете». Напротив, вузовские знания более чем пригодились на практике, а работа по профессии – только в удовольствие.

– Моя область – машинное обучение. Мне нравится, что она лежит на пересечении программирования и математики. Это как раз моя специальность и мое хобби. Придает мотивации и то, что получается применять на практике знания, полученные в университете. Повезло, что мы живем в XXI столетии, веке информационных и цифровых технологий. Такое время, когда практически все университетские курсы по математике и программированию оказались зачем-то нужны, – рассказал Ануар.

Команда работает по 3 направлениям: анализ текста, изображений и звуковых данных. В штате 15 человек.

На вопрос о том, что же такое машинное обучение, Ануар привел в пример программы Speech to Text и Text to Speech – когда машина переводит голосовые данные в текст и наоборот. На этом принципе, например, работают голосовые помощники: Siri, Alexa, Google Assistant, Яндекс Алиса. Обработкой и составлением кода для машины, конечно же, занимается человек, который подготавливает данные и «обучает» машину их понимать и преобразовывать.

Людей, занимающихся написанием таких программ, называют Data Scientist (в переводе с англ. –исследователь или аналитик данных). Эта профессия появилась совсем недавно, но уже стала одной из самых востребованных в мире.

Существуют различные платформы, где регулярно проходят соревнования по анализу данных и машинному обучению. Любой желающий из любой точки мира – студент, аналитик, инженер или доктор наук – может зарегистрироваться и посоревноваться с другими. У каждого конкурса свой призовой фонд. От его размера, конечно, зачастую зависит число участников, но в большинстве своем в таких конкурсах принимают участие не ради денег, а ради особенного соревновательного духа и интересного опыта.


Увлекательные процессы

Недавно Ануар Аймолдин победил в соревновании на площадке Kaggle, которая принадлежит компании Google и является одной из самых престижных и известных в мире.

– Я уже принимал участие в этих соревнованиях и даже выиг­рывал в команде 2 золотые и 5 серебряных медалей. Однако абсолютная победа, да еще и в одиночку – впервые. Такое достижение на этой площадке особенно ценится, так как у Kaggle есть свой рейтинг, куда входит более миллиона зарегистрированных участников со всего мира. Благодаря этой победе я получил внушительный денежный приз и поднялся на 14-е место в рейтинге среди всех пользователей, – поделился успехами Ануар.

На Kaggle приходят организации со своими предложения­ми, проектами, конкурсами, предоставляют данные и ставят разработчикам определенные задачи. Один конкурс – это 2–3 месяца напряженной работы, так как программа должна все просчитать, требуются постоянные корректировки в вычислениях.

Организатором соревнования, в котором победил Ануар, выс­тупила Ассоциация визуальной информатики в медицине (Society for Imaging Informatics in Medicine), базирующаяся в Техасе. Участникам было дано задание построить компьютерную программу, которая сможет по рентгеновскому снимку определить, есть ли у человека пневмоторакс, и обнаружить его, чтобы в дальнейшем произвести оперативное вмешательство.

Пневмоторакс – это скопление воздуха в плевральной полости вследствие повреждения легкого или стенки грудной клетки. Он доставляет большие неудобства и боль при дыхании, легкое практически не раскрывается. Между тем человеческому взгляду тяжело сходу на снимке определить месторасположение и вообще наличие пневмоторакса.

– Процесс разработки таких программ комплексный. Очень важен этап сбора и подготовки данных. Потом пишется код, в котором заложена математичес­кая модель, и выполняется на компьютере. Обычно алгоритм долго «учится», анализируя предоставленные данные. Мы ставим различные эксперименты, чтобы нейронная сеть правильно научилась выполнять свою задачу. Роль человека тоже большая, ведь существуют разные приемы и трюки, которые очень зависят от кругозора, «смекалочки» и интуиции инженера, – рассказал Ануар Аймолдин.

Алгоритм работает на искусственных нейронных сетях: сначала ему подается много примеров, где врач верным образом разметил на рентгеновском снимке облас­ти пневмоторакса. Это также могут быть снимки здорового человека, где ничего не отмечено.

– Таких картинок было «скорм­лено» алгоритму порядка 10 тысяч. Плюс около 20 тысяч неразмеченных врачами – чтобы сам алгоритм «учился» их находить. Специалисты как раз это и называют процессом обучения. Компьютер, как маленький ребенок, много смотрит на картинки и со временем начинает обучаться и улавливать нужные закономерности. Основан алгоритм на специальных математических моделях для изображений – сверточных нейронных сетях, – пояснил Ануар.

В самом соревновании участвовало 1 500 команд, среди них ведущие медицинские организации, лаборатории, энтузиасты, студенты. При этом для Казахстана оно оказалось одним из самых успешных: медали различного достоинства получили сразу нес­колько представителей нашей страны, в том числе и студенты Казахстанского филиала МГУ и Назарбаев Университета.

А что же дальше? Пока есть только алгоритм, но его еще нужно «положить в коробочку», то есть внедрить. А этот процесс в медицине, как правило, требует множества проверок. Все должно быть точно выверено, потому что на кону здоровье людей.

– Здорово, что ты можешь приносить пользу людям и облегчить жизнь медицинским работникам, не разбираясь в тонкостях медицины на таком же уровне. Конечно, это не отменяет того, что требуется полное погружение в отрасль. Мы с партнерами уже начинаем двигаться в этом направлении, хотелось бы налаживать связи с врачами и медцент­рами для внедрения сис­темы, – поделился Ануар.

Еще в планах у молодого разработчика открыть компанию, работающую в области искусственного интеллекта. Это позволит извлечь из новых технологий непосредственную пользу в виде повышения качества жизни населения, представить их реальную ценность для бизнеса и открыть дополнительные рабочие места для технических специалистов, студентов IT-специальностей.

В Казахстане эта индустрия активно развивается. Ануару с друзьями в социальной сети удалось создать целое сообщест­во энтузиастов машинного обучения, где общаются более 2 тыс. человек. В крупнейших городах регулярно организуются открытые мероприятия, где более опытные специалисты делятся своими знаниями. Новичкам всегда рады, им подсказывают, какие материалы надо освоить, чтобы совершать магию в мире компьютерных кодов. Так что, «ненейронная сеть» казахстанских разработчиков в области анализа данных и искусственного интеллекта развивается, «обучается» и растет.

Популярное

Все
Снижена административная нагрузка
Digital – путь соискателя
В Туркестане проводили первую команду новобранцев
Школа искусств открылась в селе
Смысловой каркас новой общественной этики
Условия диктует цифровая эпоха
Исполнились заветные желания
«Таза Қазақстан» продвигает идею созидательного патриотизма
Встречи с личным составом
Digital Nauryz
Баурсак-пати для горожан
Уверенный шаг в будущее
Встречают праздник добрыми делами
Юрта в стиле туаль де жуи
Праздник, который всегда с тобой
Как и где по одежке встречали
И юридический регулятор, и документ стратегического планирования
Национальный костюм – отражение истории и самобытности народа
Код Наурыза
Распоряжение Председателя Мажилиса Парламента Республики Казахстан
Военная семья – надежный тыл: семья Таубаевых
Нацгвардия получила новые служебные авто
Гвардейцы стали победителями весеннего бала в преддверии Наурыза
Наурызнама: национальные узоры в форме и на технике гвардейцев
Гвардеец знает наизусть около 100 кюев
В воинской части 5451 Нацгвардии провели церемонию «Тұсаукесер»
Военнослужащие провели благотворительную акцию в Павлодаре
Тарифы снизятся, расход уменьшится
Рост сельхозпроизводства зафиксирован в Казахстане
В Атырау начал работу особенный магазин
Референдум – 2026: весь личный состав МВД переведен на усиление
Олжас Бектенов проголосовал на республиканском референдуме
Опубликован текст новой Конституции Казахстана
Победы на турнире Alem Cup
240 единиц нового оборудования предоставит GIZ бассейновым водным инспекциям Казахстана
Ерлан Кошанов: Наш народ сделал свой исторический выбор
МЧС внедряет дроны с ИИ для спасательных операций
Референдум-2026: Обновлены данные по явке
Весна начинается с рукопожатия
Мәдениет және ұлттық салт-дәстүр күні: третий день декады Наурызнама
На страже неба: женское лицо авиации
Мужской хор Нацгвардии поздравил женщин столицы
Гвардейцы встретились со школьниками в Астане
В Конаеве начали строить КОС
Семь лет уверенного созидательного лидерства
Победитель UAE SWAT Challenge 2026 встретился со школьниками
Хор Нацгвардии произвел фурор на музыкальном шоу
Гвардеец стал призёром международных соревнований по дрон-рейсингу в Астане
Наука: от конституционного статуса к технологическому суверенитету
Арсен Томский подарил автомобиль отцу олимпийского чемпиона Михаила Шайдорова
Морозы возвращаются в Казахстан
Подставить вовремя плечо
Роналду начал переговоры о возвращении в Европу
Без наценок и посредников
В Карагандинском зоопарке – пополнение
Учебник как инструмент успеха
Развитие человеческого капитала в контексте реформ Президента
Фундамент новой эпохи независимого Казахстана
Слово о замечательном человеке
Семь человек погибло при взрыве в кафе Щучинска

Читайте также

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]