Интервью с аналитиком больших данных МегаФона
История успеха начинается с первого шага — поиска стажировки. О том, как подготовиться к этапам отбора, пройти весь путь стажера и попасть в штат, расскажет аналитик больших данных МегаФона Никита Матвеев.
Расскажи, пожалуйста, о своем опыте работы.
Я принимал участие в одном стартапе, был преподавателем по Data Science в SkillBox. Сейчас работаю на удаленке в МегаФоне. Живу в Калининграде, но по возможности приезжаю в Москву и прихожу в офис.
Чем конкретно ты занимаешься в компании, какие задачи выполняешь?
Я состою в команде, которая работает с партнерскими продуктами. Мы предлагаем абонентам подходящие, интересные для них сервисы МегаФона. Мои задачи: построение моделей машинного обучения, которые помогают анализировать предпочтения клиентов, проверка гипотез об их качестве и актуальности моделей. Еще аналитика данных, различные запросы внутри компании, исследования, продуктивизация, то есть последующая работа с теми моделями, которые хорошо себя показали.
Почему ты выбрал сферу аналитики данных? Как в нее пришел?
Я шел целенаправленно, потому что меня это заинтересовало. В каком-то подкасте на первом курсе услышал про большие данные, про возможность прогнозировать будущее с определенной точностью. И стал постепенно погружаться в эту тему, а со временем начал понимать, что все немного не так, как рассказывают в подкастах, но при этом не менее интересно.
Расскажи, как ты попал в штат МегаФона?
Я проходил стажировку в формате «акселератора» год назад. То есть по программе, где за три месяца стажеры сначала изучают важные для практики вещи, которых обычно нет в курсах или на соревнованиях по Data Science, а потом выполняют финальный проект, по итогам которого можно попасть в штат. Длилась моя стажировка с июля по октябрь, и после дополнительного собеседования я стал сотрудником компании.
Какие были самые сложные этапы стажировки? С какими трудностями ты столкнулся, перейдя в штат?
На стажировке было тяжело впервые столкнуться с тем, с чем я никогда не имел дела. Еще оказалось, что во время работы с большими данными часто возникают нюансы, которые необходимо дополнительно изучить. А чтобы получить оптимальный код, нужно учитывать много деталей и работать аккуратнее. Это было непривычно, ведь на соревнованиях я сразу накидывал весь код и тестировал его, пока не сработает.
После того, как я перешел в штат, в задачах не появилось чего-то сверхсложного, но трудно стало совмещать учебу с работой.
Получается, ты совмещал учебу и стажировку. Как тебе это удавалось?
Не пытайся играть в супергероя — сходить на пару, на перерыве выйти, куда-то побежать с ноутом, провести встречу, потом вернуться. С такой нагрузкой довольно быстро наступит выгорание. Поэтому не бойся говорить на работе о том, что в определенное время у тебя лекции, семинары или другие дела.
В университете может быть сложно рассказать преподавателям о работе, поэтому желательно научиться расставлять приоритеты и распределять свое время. В предыдущем семестре у меня даже получилось совсем не пропускать пары и при этом работать. Я думаю, что сейчас такое время, когда все готовы договариваться и идти навстречу.
Как меняются задачи по мере того, как ты растешь в компании?
Во время стажировки есть задачи, связанные с изучением материала или ресерчем по теме, дополнительная домашка. Когда я начал работать, главной задачей были адаптация и понимание устройства рабочих процессов.
По мере развития в задачах, помимо чистого кодинга, появляется больше дизайна. Необходимо представлять, как система будет работать в конечном итоге, как ее проверить на качество и оформить так, чтобы другой человек смог в ней разобраться при необходимости.
На соревнованиях по машинному обучению условие задачи обычно состоит из готового датасета и параметра, который просят предсказать. Такие задания могут быть только у стажера.
В дальнейшей работе ты самостоятельно собираешь исходные данные, определяешь параметр, оцениваешь его релевантность, думаешь, как и где модель будет использоваться, корректируешь ее при необходимости.
Ты уже несколько раз затронул тему фестивалей, соревнований, хакатонов. Можешь рассказать подробнее, что это такое?
По Data Science существуют несколько типов мероприятий. Есть фестивали-конференции, на которых участники выступают с докладами и обмениваются опытом. Еще популярны соревнования, где дана задача с подготовленными данными, на которых требуется максимально точно сделать предсказания. А есть хакатоны, те же соревнования, но с расплывчатым условием задачи. Например: «Есть проблема лесных пожаров. Решите ее за два дня с помощью искусственного интеллекта».
Для чего участвовать в таких мероприятиях? Допустим, ты начинаешь строить карьеру и хочешь пройти стажировку. Твое преимущество перед остальными кандидатами — практический навык применения моделей машинного обучения с помощью актуальных техник, который получен в ходе решения задач на соревнованиях. Участие же в хакатонах можно рассматривать не только как практику разработки минимально жизнеспособного продукта в короткие сроки, но и как тренировку умения мыслить нестандартно. А поход на конференции — хорошая возможность узнать что-то новое и зарядиться энергией от единомышленников.
Где и как ты учился кодить? Какие использовал ресурсы?
Необходимые для работы в Data Science скиллы я получил из курсов. Например, классный вариант для изучения классического машинного обучения — цикл статей и лекций от Open Data Science.
Нужна, конечно, еще фундаментальная часть, то есть математика (линейная алгебра, матанализ, статистика
А как ты относишься к YouTube, подкастам?
Мы, бывает, хотим что-то сделать и идем в YouTube за туториалом. То же самое в работе или учебе: сталкиваешься с непонятным вопросом, например, как у этой модели настроить параметры, спокойно иди в сеть на поиск ответа.
Подкасты слушать полезно. Можно найти в них интересные и неожиданные вещи. Раньше подкастов по Data Science не было, но сейчас они наконец-то начали появляться. Могу порекомендовать «Данные люди».
Что ты можешь посоветовать нашим читателям, которые только начинают строить свою карьеру в IT?
Самое главное — это найти интерес в любом деле или процессе. Тогда будет проще влиться в рабочий процесс.