(Не)хитрые алгоритмы

2938
Наталия Хомс

Легко ли обучить машину?

Всего 5 лет назад Ануар Аймолдин окончил факультет вычислительной математики и кибернетики МГУ, после – Школу анализа данных Яндекса. Теперь же он руководит командой Искусственного интеллекта (ИИ) в компании BTS Digital и шутит, что опроверг студенческий стереотип «выходя на работу, нужно забыть все, чему учили в университете». Напротив, вузовские знания более чем пригодились на практике, а работа по профессии – только в удовольствие.

– Моя область – машинное обучение. Мне нравится, что она лежит на пересечении программирования и математики. Это как раз моя специальность и мое хобби. Придает мотивации и то, что получается применять на практике знания, полученные в университете. Повезло, что мы живем в XXI столетии, веке информационных и цифровых технологий. Такое время, когда практически все университетские курсы по математике и программированию оказались зачем-то нужны, – рассказал Ануар.

Команда работает по 3 направлениям: анализ текста, изображений и звуковых данных. В штате 15 человек.

На вопрос о том, что же такое машинное обучение, Ануар привел в пример программы Speech to Text и Text to Speech – когда машина переводит голосовые данные в текст и наоборот. На этом принципе, например, работают голосовые помощники: Siri, Alexa, Google Assistant, Яндекс Алиса. Обработкой и составлением кода для машины, конечно же, занимается человек, который подготавливает данные и «обучает» машину их понимать и преобразовывать.

Людей, занимающихся написанием таких программ, называют Data Scientist (в переводе с англ. –исследователь или аналитик данных). Эта профессия появилась совсем недавно, но уже стала одной из самых востребованных в мире.

Существуют различные платформы, где регулярно проходят соревнования по анализу данных и машинному обучению. Любой желающий из любой точки мира – студент, аналитик, инженер или доктор наук – может зарегистрироваться и посоревноваться с другими. У каждого конкурса свой призовой фонд. От его размера, конечно, зачастую зависит число участников, но в большинстве своем в таких конкурсах принимают участие не ради денег, а ради особенного соревновательного духа и интересного опыта.


Увлекательные процессы

Недавно Ануар Аймолдин победил в соревновании на площадке Kaggle, которая принадлежит компании Google и является одной из самых престижных и известных в мире.

– Я уже принимал участие в этих соревнованиях и даже выиг­рывал в команде 2 золотые и 5 серебряных медалей. Однако абсолютная победа, да еще и в одиночку – впервые. Такое достижение на этой площадке особенно ценится, так как у Kaggle есть свой рейтинг, куда входит более миллиона зарегистрированных участников со всего мира. Благодаря этой победе я получил внушительный денежный приз и поднялся на 14-е место в рейтинге среди всех пользователей, – поделился успехами Ануар.

На Kaggle приходят организации со своими предложения­ми, проектами, конкурсами, предоставляют данные и ставят разработчикам определенные задачи. Один конкурс – это 2–3 месяца напряженной работы, так как программа должна все просчитать, требуются постоянные корректировки в вычислениях.

Организатором соревнования, в котором победил Ануар, выс­тупила Ассоциация визуальной информатики в медицине (Society for Imaging Informatics in Medicine), базирующаяся в Техасе. Участникам было дано задание построить компьютерную программу, которая сможет по рентгеновскому снимку определить, есть ли у человека пневмоторакс, и обнаружить его, чтобы в дальнейшем произвести оперативное вмешательство.

Пневмоторакс – это скопление воздуха в плевральной полости вследствие повреждения легкого или стенки грудной клетки. Он доставляет большие неудобства и боль при дыхании, легкое практически не раскрывается. Между тем человеческому взгляду тяжело сходу на снимке определить месторасположение и вообще наличие пневмоторакса.

– Процесс разработки таких программ комплексный. Очень важен этап сбора и подготовки данных. Потом пишется код, в котором заложена математичес­кая модель, и выполняется на компьютере. Обычно алгоритм долго «учится», анализируя предоставленные данные. Мы ставим различные эксперименты, чтобы нейронная сеть правильно научилась выполнять свою задачу. Роль человека тоже большая, ведь существуют разные приемы и трюки, которые очень зависят от кругозора, «смекалочки» и интуиции инженера, – рассказал Ануар Аймолдин.

Алгоритм работает на искусственных нейронных сетях: сначала ему подается много примеров, где врач верным образом разметил на рентгеновском снимке облас­ти пневмоторакса. Это также могут быть снимки здорового человека, где ничего не отмечено.

– Таких картинок было «скорм­лено» алгоритму порядка 10 тысяч. Плюс около 20 тысяч неразмеченных врачами – чтобы сам алгоритм «учился» их находить. Специалисты как раз это и называют процессом обучения. Компьютер, как маленький ребенок, много смотрит на картинки и со временем начинает обучаться и улавливать нужные закономерности. Основан алгоритм на специальных математических моделях для изображений – сверточных нейронных сетях, – пояснил Ануар.

В самом соревновании участвовало 1 500 команд, среди них ведущие медицинские организации, лаборатории, энтузиасты, студенты. При этом для Казахстана оно оказалось одним из самых успешных: медали различного достоинства получили сразу нес­колько представителей нашей страны, в том числе и студенты Казахстанского филиала МГУ и Назарбаев Университета.

А что же дальше? Пока есть только алгоритм, но его еще нужно «положить в коробочку», то есть внедрить. А этот процесс в медицине, как правило, требует множества проверок. Все должно быть точно выверено, потому что на кону здоровье людей.

– Здорово, что ты можешь приносить пользу людям и облегчить жизнь медицинским работникам, не разбираясь в тонкостях медицины на таком же уровне. Конечно, это не отменяет того, что требуется полное погружение в отрасль. Мы с партнерами уже начинаем двигаться в этом направлении, хотелось бы налаживать связи с врачами и медцент­рами для внедрения сис­темы, – поделился Ануар.

Еще в планах у молодого разработчика открыть компанию, работающую в области искусственного интеллекта. Это позволит извлечь из новых технологий непосредственную пользу в виде повышения качества жизни населения, представить их реальную ценность для бизнеса и открыть дополнительные рабочие места для технических специалистов, студентов IT-специальностей.

В Казахстане эта индустрия активно развивается. Ануару с друзьями в социальной сети удалось создать целое сообщест­во энтузиастов машинного обучения, где общаются более 2 тыс. человек. В крупнейших городах регулярно организуются открытые мероприятия, где более опытные специалисты делятся своими знаниями. Новичкам всегда рады, им подсказывают, какие материалы надо освоить, чтобы совершать магию в мире компьютерных кодов. Так что, «ненейронная сеть» казахстанских разработчиков в области анализа данных и искусственного интеллекта развивается, «обучается» и растет.

Популярное

Все
Гвардейцы поздравили жителей Кокшетау с Днем Конституции
«Писатель был бойцом в большом и малом...»
В приоритете цифровая безопасность
Правовое государство – подлинно историческая идея нации
Хранить раритеты – почетная миссия
Основной закон выражает идеалы и ценности общества
Каждый шаг на благо людей
Социальные выплаты гарантированы
Вставай рано и здоровайся на казахском
ИИ активно внедряют в школьную программу
Где живут властелины реки
Стандарт студенческой среды ЕНУ
Обучение никогда не заканчивается
Вот и лето прошло
Актогай раскрывает секреты
Шел солдат, преград не зная
Спорт и двуязычие дают преимущество
Послание Президента 2024: Принцип «Закон и порядок» как основа справедливого Казахстана
Музей с шахтерской атмосферой
Шпаргалочки на память
Военнослужащие Нацгвардии провели акцию «Дорога в школу»
Аким Мангистау ознакомился с ходом строительства социальных объектов
Бектенов поручил внести предложения по наказанию виновных в срыве дорожных проектов
Жители Шымкента не спешат платить
Казахстан укрепил свой статус международного транзитного хаба
Аэропорты Астаны, Алматы, Шымкента и Актобе станут мультимодальными центрами мирового уровня
Астанчанин оформил миллионные автокредиты на четверых казахстанцев
Проезд сделали бесплатным
Модернизацию объектов энергетики проверили в Степногорске и ЗКО
Новую школу построят в Атырау
О чем расскажут старинные карты
Три древние статуи подняли со дна моря в Египте
Парк воздушных судов пополнится новыми самолетами в РК
S&P улучшило прогноз Казахстана со стабильного на позитивный
Литературная карта мира
Токаев поздравил Зеленского с Днем независимости
Комедия «Укради жениха если сможешь»: смех, слезы и казахская душа
Курс на формирование устойчивой гендерной политики
Сильная жара вернется в Казахстан
Индустрия детских товаров ждет поддержки
До конца 2025 года в Казахстане введут обязательную маркировку моторных масел
Гвардейцы впервые стали чемпионами МВД РК по спортивному самбо
В Кызылординской области все больше сёл отказываются от продажи алкоголя
Гвардеец завоевал бронзу на ЧМ по пляжному самбо в Сингапуре
О погоде в Казахстане на первые дни августа рассказали синоптики
Нацбанк начал валютные интервенции
Где и когда посмотреть результаты конкурса грантов?
Гвардеец стал призёром конкурса по популяризации наследия Абая
В Астане 125 новобранцев дали клятву Родине
Незаконные постройки снесут в Уральске
Найдены личные вещи членов экипажа пропавшего на Сорбулаке вертолета
Четыре человека погибли в жуткой аварии в Актюбинской области
Алматинская область подарила земле Абая скульптуру «Золотой человек»
Дженнифер Лопес в Астане: что важно знать перед концертом
Дожди и град ожидаются в Казахстане в ближайшие дни
Модернизация на особом контроле
В Павлодаре откроют первую комфортную школу
На концерт Дженнифер Лопес в Ереване потратили $7 млн
Госаудит проверил расходы казахстанской науки
В МВД предупредили о новой схеме мошенничества при бронировании жилья

Читайте также

Архив

  • [[year]]
  • [[month.label]]
  • [[day]]