Big Data
Представьте Excel-лист. Все, что в него не вмещается, у айтишников принято считать большими данными. Это миллионы строк и тысячи столбцов!
Что такое Big Data
Big Data – это по сути, работа с большими данными, которая в конечном итоге может выводить определенные закономерности. Даже такие закономерности, которых никто не ожидал выявить. Примеры использования Big Data в бизнесе:
Нужно понимать, что Big Data – это работа с неструктурированными данными. Перед вами – информация о миллионах пользователей и из этой информации нужно сделать умозаключения.
Big Data состоит из трех элементов:
- данные;
- аналитика;
- технологии.
Если оценивать рынок Казахстана, специалисты по Big Data в среднем зарабатывают около 350 тысяч тенге. Эта профессия считается одной из 10 самых востребованных специальностей на сайтах по поиску работы.
Как проходит рабочий день аналитика
Тех, кто работает с большими данными, называют аналитиками. Как говорит преподаватель AlmaU Тимур Бакибаев, у аналитика работа делится не по дням, а по неделям:
Первый этап работы – это переговоры с большим количеством топ-менеджеров, отделов, департаментов компаний. Это делается для того, чтобы понять, что хотят узнать руководители и какие рабочие вопросы у них есть.
После того, как пройдут недели переговоров, анализа всех принятых запросов, аналитик приступает к сбору данных. Он запрашивает от отделов компании данные, например у маркетингового или финансового отдела. Если данных нет, то заново запускается генерация их генерация.
Третий этап – это обработка данных, их чистка, сортировка. Не всегда данные изначально бывают «читабельными» для компьютеров. Поэтому аналитик вручную должен привести данные в порядок.
После обработки данных, аналитик делает определенные анализы, выводы.
И уже, в четвертых, презентует результаты руководству.
С чего начать
Чтобы стать аналитиком, необходимо получить высшее образование. В университете AlmaU есть специальность «Big Data and Business Analytics», которая обучает будущих аналитиков. Большие данные отличаются от бизнес-аналитики. Большие данные могут охватить миллионы данных. В то время как бизнес-аналитика может охватить аналитику одной или нескольких компаний.
Самыми ходовыми программами по работе с Big Data считаются Python и Jupyter Notebook. После 4-х лет обучения в AlmaU, студент полностью овладеет этими программами.
Декан Школы инженерного менеджмента AlmaU Куаныш Абешев говорит, что для начала человеку должна нравиться математика, алгебра, физика. Он должен иметь аналитический склад ума. Если у вас есть такие качества, то можете реализовать себя в качестве аналитика.
Самые сочные предметы по Big Data в AlmaU
Data Visualization / Визуализация данных
Во время курса студенты обучаться правильному представлению количественных и качественных данных для помощи в принятии решений. Графики позволяют увидеть взаимосвязь между данными или тенденцию каких-либо показателей.
Natural Language Processing / Обработка естественного языка
Курс раскрывает вопросы пересечения естественных языков с информатикой. На этом курсе студенты узнают, что полезного может сделать компьютер с естественными языками, например, перевод с русского на казахский, фильтрация нежелательной почты, извлечение данных из социальных сетей и поиск основных тем в новостных лентах.
Image Processing and Pattern Recognition / Обработка изображения и распознавание образов
На данном курсе студенты обучатся распознаванию отпечатков пальцев, лиц, номерных знаков или других образов с помощью нейронных сетей.
Machine Learning and Clustering / Машинное обучение и кластеризация
Рассматриваются методы искусственного интеллекта для решения задач оптимизации, статистических расчетов и планирования, а также рассматриваются задачи распознования образов для прогнозирования и классификации.
Blockchain Programming / Blockchain программирование
Курс начинается с основ криптографии и экономики и переходит к идеям создания криптовалют и технологии blockchain. На курсе так же будут рассмотрены фундаментальные принципы работы Bitcoin.
Преподаватели:
Бакибаев Тимур Ибрайханович, Ph.D.
Абешев Куаныш Шурабатырович, Ph.D.
Якунин Кирилл Олегович, MSc