Онлайн-курс

Data Science

Обратите внимание!

Это мероприятие состоялось или было отменено.

Вы можете отправить запрос portal@rosbo.ru и узнать, планируется ли повторное обучение или есть ли подобные программы

Просим вас уточнить город, название программы, url страницы и ваши контакты

Дата

01.08.2020

6 недель

Цена

27000  -8%
скидка

Место проведения

Дистанционно

4 недели (40 часов с преподавателем+ 20 часов на домашние задания)

Data Science (наука о данных)  – один из самых мощных инструментов анализа, который позволяет из самых неочевидных чисел сложить новую картину мира. Сейчас под этим термином подразумевают методы работы с данными ("большими данными", или Big Data), позволяющими распределенно обрабатывать информацию.

Data Scientist — это специалист по обработке, анализу и хранению больших массивов данных, которые называют «Big Data». Его главная задача — извлекать необходимую информацию из разнообразных источников, используя информационные потоки в режиме реального времени и устанавливать скрытые закономерности в массивах данных,  статистически анализировать их для принятия грамотных бизнес-решений. 

Эти технологии востребованы в компаниях различного профиля: телеком, финтех, ритейл, e-commerce.  Среди них и крупнейшие российские компании, такие как  Сбербанк, Альфа Банк, Mail.ru.

На основании больших массивов информации компании выстраивают маркетинговые стратегии и прогнозируют глобальные изменения на рынке и в мире. Специалисты по сбору и анализу больших данных – пока штучный товар, а популярность этой профессии все больше набирает обороты. 

На нашем курсе по Data Science вы научитесь анализировать на огромные цифры и видеть в них закономерности, делать правильные выводы из статистических данных, освоите новые методы обработки информации и сможете применить полученные знания на практике. 

Этот курс для тех, кто: 

  • хочет освоить новую профессию аналитика данных (Data Scientist)
  • планирует освоить новые инструменты анализа данных  в рамках текущей работы
  • слышал о Big Data, но боялся спросить и заинтересован в более глубоком погружении в эту сферу
  • любит анализировать, искать причины, следствия и делать выводы

Требования: 

Для успешного прохождения курса вы должны иметь базовый уровень программирования на любом языке. Например, уметь написать функцию, которая считает сумму квадратов первых n натуральных чисел. 

Преимущества курса:

  • Вы получите редкую, востребованную и одну из самых высокооплачиваемых профессий в мире
  • Освоите эффективные инструменты анализа данных
  • Сможете применить знания в текущем проекте или на на практике в рамках курса
  • Получите отличные перспективы трудоустройства

Программа курса:

Общий инструментарий SQL, Python, Pandas

Познакомимся с самыми основами инструментария, а также узнает общий уровень подготовки группы.

Линейная регрессия

Задачи регрессии и классификации. Метрики качества регрессии MSE, MAE, критерии выбора метрики. Линейная регрессия.

Переобучение

Переобучение, способы борьбы с ним.

Категориальные признаки

Работа с категориальными признаками: label encoding, one hot encoding, average encoding.

Регуляризация

Регуляризация на примере линейной регрессии. Ridge, Lasso. Bias vs variance.

Задача классификации

Логистическая регрессия. Метрики качества классификации: accuracy, precision, recall, roc auc, gini.

Деревья, ансамбли деревьев

Decision Tree. Методы комбинирования алгоритмов: bagging, boosting. Случайный лес, градиентный бустинг. 

Задачи снижения размерности, кластеризации

Метод главных компонент, PCA. EM-алгоритмы. K-Means.

Нейронные сети

Основы нейронных сетей. Их «настройка», подбор параметров, борьба с переобучением. Решения задач распознавания изображений.

Ограничения машинного обучения. 

Области применимости пройденных алгоритмов.

 

Курс преподает: 

Евгений Сальский -  Аналитик, занимается разработкой и сопровождением системы кредитного скоринга. Из технологий владеет - Excel, Power Pivot, SQL Server, Python (XGBoost, Flask + стандартные библиотеки). 

Имеет большой опыт преподавания (школьники ОГЭ и ЕГЭ, студенты всех курсов).

Считает, что деятельность  преподавателя - интересна и она увлекает его больше всего. 

Говорит, что обучая других, сам повышает свою  компетентность в преподаваемом предмете.

Знает, как применить математические методы и Data Science, чтобы посмотреть на данные по-новому. 

Что получите по итогам курса: 

  • Практические и теоретические знания о Big Data и Data Science
  • Освоите новые аналитические инструменты
  • Научитесь анализировать большие массивы информации
  • Получите рекомендации по трудоустройству

ОТЗЫВЫ О КОМПАНИИ