Сайт "Бизнес-обучение"
Поможем подобрать курс!
Отправим запрос
нескольким учебным центрам!
Услуга предоставляется бесплатно!
Пишите: portal@rosbo.ru
Поможем подобрать курс!
Отправим запрос
нескольким учебным центрам!
Услуга предоставляется бесплатно!
Пишите: portal@rosbo.ru
Онлайн-курс
Дата
01.08.2020
6 недель
Цена
Компания
Место проведения
Дистанционно
Направления
4 недели (40 часов с преподавателем+ 20 часов на домашние задания)
Data Science (наука о данных) – один из самых мощных инструментов анализа, который позволяет из самых неочевидных чисел сложить новую картину мира. Сейчас под этим термином подразумевают методы работы с данными ("большими данными", или Big Data), позволяющими распределенно обрабатывать информацию.
Data Scientist — это специалист по обработке, анализу и хранению больших массивов данных, которые называют «Big Data». Его главная задача — извлекать необходимую информацию из разнообразных источников, используя информационные потоки в режиме реального времени и устанавливать скрытые закономерности в массивах данных, статистически анализировать их для принятия грамотных бизнес-решений.
Эти технологии востребованы в компаниях различного профиля: телеком, финтех, ритейл, e-commerce. Среди них и крупнейшие российские компании, такие как Сбербанк, Альфа Банк, Mail.ru.
На основании больших массивов информации компании выстраивают маркетинговые стратегии и прогнозируют глобальные изменения на рынке и в мире. Специалисты по сбору и анализу больших данных – пока штучный товар, а популярность этой профессии все больше набирает обороты.
На нашем курсе по Data Science вы научитесь анализировать на огромные цифры и видеть в них закономерности, делать правильные выводы из статистических данных, освоите новые методы обработки информации и сможете применить полученные знания на практике.
Этот курс для тех, кто:
Требования:
Для успешного прохождения курса вы должны иметь базовый уровень программирования на любом языке. Например, уметь написать функцию, которая считает сумму квадратов первых n натуральных чисел.
Преимущества курса:
Общий инструментарий SQL, Python, Pandas
Познакомимся с самыми основами инструментария, а также узнает общий уровень подготовки группы.
Линейная регрессия
Задачи регрессии и классификации. Метрики качества регрессии MSE, MAE, критерии выбора метрики. Линейная регрессия.
Переобучение
Переобучение, способы борьбы с ним.
Категориальные признаки
Работа с категориальными признаками: label encoding, one hot encoding, average encoding.
Регуляризация
Регуляризация на примере линейной регрессии. Ridge, Lasso. Bias vs variance.
Задача классификации
Логистическая регрессия. Метрики качества классификации: accuracy, precision, recall, roc auc, gini.
Деревья, ансамбли деревьев
Decision Tree. Методы комбинирования алгоритмов: bagging, boosting. Случайный лес, градиентный бустинг.
Задачи снижения размерности, кластеризации
Метод главных компонент, PCA. EM-алгоритмы. K-Means.
Нейронные сети
Основы нейронных сетей. Их «настройка», подбор параметров, борьба с переобучением. Решения задач распознавания изображений.
Ограничения машинного обучения.
Области применимости пройденных алгоритмов.
Евгений Сальский - Аналитик, занимается разработкой и сопровождением системы кредитного скоринга. Из технологий владеет - Excel, Power Pivot, SQL Server, Python (XGBoost, Flask + стандартные библиотеки).
Имеет большой опыт преподавания (школьники ОГЭ и ЕГЭ, студенты всех курсов).
Считает, что деятельность преподавателя - интересна и она увлекает его больше всего.
Говорит, что обучая других, сам повышает свою компетентность в преподаваемом предмете.
Знает, как применить математические методы и Data Science, чтобы посмотреть на данные по-новому.
Что получите по итогам курса: