Дмитрий Русанов: «Спрос на Data Science будет расти»

Новости

Июнь 27, 2018

Дмитрий Русанов: «Спрос на Data Science будет расти»

11 июня в Almaty Management University начала свою работу бесплатная школа для аналитиков данных Yessenov Data Lab. Ее первыми учащимися стал 21 студент, прошедший этой весной конкурс.

Проект является совместным – он организован фондом им. академика Ш.Есенова совместно с AlmaU.

Цель проекта – подготовка аналитиков, содействие применению анализа данных в науке и стимулирование исследовательской деятельности в этой сфере, применение навыков анализа данных в казахстанских организациях и компаниях. Лекторами школы стали ведущие специалисты в этой области. Среди них Дмитрий Котовенко (AGT International, Frankfurt) и Марина Горлова (Yandex.Money, Санкт-Петербург), профессора AlmaU Куаныш Абешев и Тимур Бакибаев, получившие докторские степени в США и Германии, а также Михаил Липкович и Дмитрий Русанов (EPAM Systems, Санкт-Петербург). 

Data Science (аналитика данных) – дисциплина, которую в AlmaU преподают с 2017 года. Big Data – это работа с неструктурированными большими данными, например, когда из информации о миллионах пользователей нужно сделать определенные выводы, которые помогут компании лучше удовлетворять запросы клиента.

Если оценивать рынок Казахстана, специалисты по Big Data в среднем зарабатывают около 350 тысяч тенге. Эта профессия считается одной из 10 самых востребованных специальностей на сайтах по поиску работы.

В школе Yessenov Data Lab студенты изучают введение в курс Data Science и самые простые алгоритмы, линейную регрессию и классификацию, логистическую регрессию.

О том, как проходит обучение, рассказывает один из лекторов школы, Дмитрий Русанов.

- Какую оценку дали бы проекту?

- Очень неплохой проект, хотя немного сжатая программа. Особенно мне понравилось, что идет активное общение между преподавателями и студентами. И очень хорошо, что удалось привлечь представителей разных компаний, которые ставят свои задачи, рассказывают, что они занимаются какими-то подобными кейсами, предлагают студентам что-то решить. И студенты сразу имеют возможность увидеть перспективу отрасли. Я, со своей стороны, даю им какие-то наметки, что можно было бы попробовать применить для решения задач от этих компаний. То есть у них сразу есть возможность свежие, только что полученные знания, применить на каких-то более или менее реальных кейсах и возможность трудоустройства. Это должно их очень хорошо мотивировать.

- Как вам казахстанские студенты?

- Выборка, конечно, небольшая. Но, на мой взгляд, есть несколько особенностей: например, ментально людям тяжело самостоятельно работать. Они хотят, чтобы им все показали, а потом повторить. У нас были некоторые разногласия на эту тему со студентами, потому что я им говорил, чтобы они пробовали делать что-то сами, а им все время казалось, что лучше бы, чтобы им рассказали, дали готовый рецепт. Я им объяснял: вместо рыбы я дам вам удочку.

- А степень их подготовки как бы вы оценили?

- Насколько я знаю, цель отбора в том, чтобы студенты были не столько сильными математиками, сколько мотивированными людьми, нацеленными на работу в конкретных проектах. Чтобы студенты с других специальностей могли попробовать себя в этой области. Она не должна ограничиваться исключительно студентами математических факультетов.

- Потребность рынка в таких специалистах сейчас высока?

- Ну, раз приходят представители компаний… Я вижу, что в Казахстане Data Science в зародыше. В России, Москве, Петербурге, некоторых других городах это направление сейчас вовсю развивается. В Казахстане пока больше интереса, чем реальных проектов. В ближайшее время, и это очевидно, будет рост спроса на таких специалистов. Да и студенты, мне кажется, не зря пришли летом тратить свое время, когда можно поехать куда-нибудь искупаться.

- Как вам программа школы?

- Довольно продвинутая. Конечно, за 6 недель невозможно стать хорошим специалистом. Это базовый курс, довольно интересный, в нем есть применение новейших алгоритмов, нейронных сетей, о которых сейчас многие говорят с придыханием. И организован проект, я считаю, очень неплохо.

- Нейронные сети давно появились в России?

- Сами нейронные сети – это алгоритм, который появился еще в 40-х годах прошлого века, примерно с 2000-2010 годов начался прогресс в работе с большими данными, то есть в экономике появились предприятия, которые создают и применяют очень большое количество данных. Кроме того, рост производительности компьютеров вывел эти алгоритмы на новый уровень, и они стали давать очень хороший результат. Вы же знаете, что в Яндекс переводчике в последнее время очень улучшилось качество перевода – это связано именно с тем, что они применяют архитектуру нейронных сетей, распознавание образов (есть разные приложения). Даже такие банальные приложения, которыми девушки пользуются, чтобы приукрасить себя, - это тоже делается с помощью нейронных сетей. Очень много областей их применения, многие пока просто для развлечения, но рано или поздно на этом фундаменте появятся и новые бизнесы. Сами по себе нейронные сети – один из многих алгоритмов, просто он имеет свои особенности, которые дают на определенных данных и задачах очень хорошие результаты.

- Что должен знать и уметь Data Scientist (специалист по анализу данных)?

- Data Scientist должен знать математику, немного уметь программировать и хорошо знать какую-то область применения. Например, если он работает с финансами, он должен иметь какое-то понимание, что это за данные, чтобы, если алгоритм выдаст ошибку, он понимал, от чего это зависит: от самого алгоритма, или от того, что были введены неправильные данные.

- Что будет уметь выпускник Yessenov Data Lab на выходе?
- Будет уметь решать простые задачи, знать основные алгоритмы Data Science, знать, как с ними работать, и где найти дополнительную информацию, чтобы специализироваться. И это уже немало.

В наше время обучение не имеет границ, люди должны учиться самостоятельно. Очень много community в интернете, есть книги и авторы, которые популяризуют это направление. Многие даже не требуют защиты авторских прав. Книги выложены - можно читать.

- В чем преимущество данного курса?

- Преимущество не в том, что он дает какое-то более глубокое понимание в области анализа данных. Сильная сторона курса – вы можете расспросить специалистов про пути решения каких-то реальных задач, вникнуть в маленькие тонкости алгоритмов, иногда нужно довольно много времени, чтобы до них дойти, потому что они не лежат на поверхности. Они сами по себе могут быть весьма тривиальными, но нужно знать, как их применять на практике. Да и познакомиться с местными фирмами, понять, решение каких реальных задач нужно бизнесу, – дорогого стоит. Это и есть сильная сторона курса.

Поделиться: