Какой может быть ваша карьера

Должность

Специалист по Data Science

А вот технологии и инструменты, которые будете использовать

Мы регулярно сверяем нашу программу курса с действующими аналитиками и руководителями из индустрии. Вы учитесь только тому, что актуально.

Python
Jupyter Notebook
Pandas
SQL
Keras
Catboost
Scikit-learn

Начните зарабатывать, анализируя

Вы начнёте с junior-позиции, а дальше только вперёд. Будете шагать по карьерной лестнице и расти в цене. И однажды цены вам не будет.

Источник данных: Хабр Карьера
60 000 ₽
Junior специалист по Data Science с опытом до года
120 000 ₽
Middle специалист по Data Science с опытом от 1 года до 3 лет
210 000 ₽ +
Senior специалист по Data Science с опытом 3+ лет

Как мы учим

Здесь трудно, но интересно. Учёба на курсе занимает 8 месяцев. Много теории, ещё больше практики, люди и методология — всё направлено на то, чтобы вы освоили профессию специалиста по Data Science.

YandexGPT помогает учиться

Когда в теории что-то непонятно, нейросеть объяснит это другими словами. А в конце каждого урока подготовит краткий пересказ о самом главном.

Посмотрите истории выпускников Практикума

Решиться на смену профессии — вызов, но сможет каждый, если приложить усилия. Это истории тех, кто уже занимается любимым делом.
4,7
TutorTop
4,5
IRecommend
4,3
Отзовик

10 000+ выпускников Практикума уже нашли новую работу

И сделали это в первые 4 месяца после учёбы. Это подтверждено исследованием, которое мы провели вместе с Высшей школой экономики. Вот в каких компаниях работают выпускники.

Программа курса

Мы обновляем её регулярно, чтобы материалы соответствовали запросам индустрии и работодателей. Другими словами, вы учитесь только тому, что точно пригодится в работе.
7 тем・1 проект・~8 часов
Бесплатно
Основы Python и анализа данных
Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики данных и специалисты по Data Science
  • Python
  • Pandas
  • Seaborn
  • Переменные
  • Типы данных
  • Гипотезы
  • Ошибки
  • Тепловые карты
Moscow Catnamycs
Вывод данных на экран. CSV-файлы. Работа с таблицами. Тепловые карты. Умножение столбца на целое число.
Ошибки в коде
Синтаксические ошибки. Ошибки наименования. Ошибки при делении на ноль. Ошибки при импорте модуля.
Переменные и типы данных
Переменные. Типы данных. Арифметические операции с числами и строками.
Как выдвигать гипотезы
Гипотезы. HADI-циклы. Аналитическое мышление. Чтение графиков.
Работа в области данных
Задачи аналитика. Уточнение задач. Декомпозиция. Стадии проекта.
Машинное обучение
Модель. Обучающая и тестовая выборки. Объект и признак. Метрика Евклида. Алгоритм k-ближайших соседей (kNN). Библиотека Scikit-learn.
Примените методы группировки и суммы, сегментируете пользователей и решите задачи классификации
2
12 тем・1 проект・2 недели
Базовый Python
  • Python
  • Pandas
  • Переменные
  • Типы данных
  • Строки
  • Списки
  • Циклы
  • Условный оператор
  • Функции
  • Словари
  • Датафрейм
Переменные и типы данных
Язык Python. Переменные. Вывод объектов и данных на экран. Обработка ошибок, оператор try-except. Типы данных. Преобразования типов данных.
Строки
Индексы в строках. Срезы строк. Операции над строками. Методы строк. Форматирование строк, метод format(), f-строки.
Списки
Индексы в списках. Срезы списков. Добавление и удаление элементов. Сложение и умножение, сортировка списков. Поиск элементов в списке. Разделение строки в список строк, соединение списка строк.
Цикл for
Перебор элементов. Перебор индексов элементов. Обработка элементов списков с помощью циклов: нахождение суммы и произведения элементов.
Вложенные списки
Циклы по вложенным спискам с подсчётом значений. Добавление элементов во вложенные списки. Сортировка вложенных списков.
Условный оператор
Цикл while. Логический тип данных. Булевы значения. Логические и составные логические выражения. Условный оператор if, elif, else. Ветвления. Фильтрация списков с использованием условного оператора. Цикл while.
Функции
Назначение функций. Параметры и аргументы. Параметры со значениями по умолчанию. Позиционные и именованные аргументы. Возвращение результата из функции.
Словари
Ключи и значения. Поиск значения по ключу. Добавление элементов в словарь. Список словарей. Красивый вывод словарей.
Библиотека Pandas
Чтение CSV-файлов. Датафрейм. Конструктор датафрейма. Вывод первых и последних строк датафрейма. Индексация в датафреймах. Индексация в столбцах Series.
Предобработка данных
Принцип GIGO. Переименование столбцов датафрейма. Обработка пропущенных значений. Обработка явных и неявных дубликатов.
Анализ данных
Группировка данных. Сортировка данных. Основы описательной статистики. Оформление результатов.
Jupyter Notebook — тетрадь в ячейку
Интерфейс и шорткаты Jupyter Notebook.
Сравните данные пользователей Яндекс Музыки по городам и дням недели
3
6 тем・1 проект・2 недели
Предобработка данных
  • Python
  • Pandas
  • Предобработка данных
  • Обработка пропусков
  • Обработка дубликатов
  • Категоризация данных
Работа с пропусками
Конверсия. Куки. Категориальные и количественные переменные, обработка пропусков в них. Обработка пропусков в количественных переменных по категориям.
Изменение типов данных
Чтение Excel-файлов. Преобразование Series к числовому типу. Модуль числа, метод abs(). Работа с датой и временем. Обработка ошибок, оператор try-except. Объединение датафреймов, метод merge(). Сводные таблицы.
Поиск дубликатов
Классический метод поиска дубликатов. Поиск дубликатов с учётом регистра.
Категоризация данных
Декомпозиция таблиц. Категоризация по числовым диапазонам. Категоризация на основе нескольких значений в строке.
Критическое и системное мышление
Системное мышление. Причины ошибок в данных. Критическое мышление.
Проанализируете данные о клиентах банка, определите долю кредитоспособных
4
6 тем・1 проект・2 недели
Исследовательский анализ данных
  • Python
  • Pandas
  • Matplotlib
  • Анализ данных
  • Срезы данных
  • Описательная статистика
  • Гистограммы
  • Диаграмма размаха
  • Диаграмма рассеяния
  • Визуализация данных
Первые графики и выводы
Применение сводных таблиц. Гистограмма. Распределения. Диаграмма размаха.
Изучение срезов данных
Метод query(). Работа с датой и временем. Построение графиков методом plot(). Бритва Оккама.
Работа с несколькими источниками данных
Срез данных на основе внешних объектов. Добавление новых столбцов в датафрейм. Добавление данных из других датафреймов. Переименование столбцов. Объединение таблиц.
Взаимосвязь данных
Диаграмма рассеяния. Корреляция переменных. Матрица диаграмм рассеяния.
Валидация результатов
Укрупнение групп. Разбиение данных по группам.
Исследуете архив объявлений о продаже объектов недвижимости в Петербурге и Ленобласти
5
6 тем・1 проект・2 недели
Статистический анализ данных
  • Python
  • Pandas
  • SciPy
  • NumPy
  • Matplotlib
  • Комбинаторика
  • Теория вероятностей
  • Распределения
  • Проверка гипотез
Комбинаторика
Комбинации. Правило умножения. Перестановки. Количество перестановок. Размещения. Число размещений. Сочетания. Число сочетаний.
Теория вероятностей
Эксперимент. Вероятностное пространство. События. Вероятность. Пересекающиеся и взаимоисключающие события. Диаграмма Эйлера-Венна. Закон больших чисел.
Описательная статистика
Категориальные и количественные переменные. Мода и медиана. Среднее значение. Дисперсия. Стандартное отклонение. Квартили и процентили. Диаграмма размаха. Столбчатая диаграмма. Плотность частоты. Гистограмма.
Случайные величины
Случайная и дискретная случайная величина. Распределение вероятностей для дискретной случайной величины. Кумулятивная функция, математическое ожидание и дисперсия дискретной случайной величины.
Распределения
Эксперимент Бернулли. Биномиальный эксперимент. Распределения: непрерывное равномерное, нормальное и стандартное нормальное. CDF, PPF для нормального распределения. Распределение Пуассона. Аппроксимация одного распределения другим.
Проверка гипотез
Генеральная совокупность. Выборка. Выборочное распределение. Центральная предельная теорема. Односторонние и двусторонние гипотезы. P-Value. Проверка гипотезы о равенстве средних двух генеральных совокупностей.
Проверите гипотезы сервиса аренды самокатов, чтобы помочь вырастить бизнес
6
1 проект・1 неделя
Первый большой проект
Научитесь предварительному исследованию данных, сформулируете и проверите гипотезы. Найдёте закономерности в данных о продаже игры.
7
8 тем・1 проект・2 недели
Линейные модели в машинном обучении
  • Scikit-learn
  • NumPy
  • Линейная алгебра
  • Линейная регрессия
  • Задача классификации
  • Логистическая регрессия
  • Подготовка данных
Основы машинного обучения
Понятие моделирования. Схема моделирования. Понятие машинного обучения. Типы данных. Виды машинного обучения. Входные признаки. Целевые признаки. Scikit-learn. Тренировочная выборка. Валидационная выборка. Тестовая выборка. Метрики качества.
Линейная алгебра для машинного обучения
Вектор. Векторные операции. Сходство векторов. Матрица. Матричные операции. Скалярное произведение. Матричное умножение. Определитель матрицы. Обратные матрицы.
Подготовка данных для машинного обучения
Подготовка данных. Мультиколлинеарность. Кодирование. Масштабирование. Анализ остатков модели.
Задача регрессии и линейная регрессия
Задача регрессии. Линейная регрессия. MSE. MAE. R². Математическая основа линейной регрессии.
Классификация и логистическая регрессия
Задача классификации. Бинарная и мультиклассовая классификации. Порог классификации. Логистическая регрессия. Матрица ошибок. Accuracy. Точность, полнота, математическая основа логистической регрессии.
Разработаете модель машинного обучения, которая поможет владельцам молочной фермы принимать эффективные решения
8
7 тем・1 проект・3 недели
Обучение с учителем: качество модели
  • SVM
  • kNN
  • Переобучение, недообучение
  • Гиперпараметры
  • Отбор признаков
  • Пайплайн
Модели классификации
Метод опорных векторов. Линейное, полиномиальное ядро SVM. Ядро RBF. Метод k-ближайших соседей. Подходы к многоклассовой классификации.
Проблема переобучения
Проблемы переобучения и недообучения. Смещение, разброс, регуляризация.
Проблема дисбаланса классов
Дисбаланс классов. Кросс-валидация.
Подбор гиперпараметров
Параметры. Гиперпараметры. GridSearchCV. RandomizedSearchCV. OptunaSearchCV.
Работа с признаками
OneHotEncoding. OrdinalEncoder. Утечка целевого признака. Попарная корреляция входных признаков. Feature Engineering.
Отбор признаков
Фильтрация для отбора признаков. SelectKBest. Интерпретация модели. Значимость признаков.
Пайплайн обучения
Создание пайплайна. Sklearn Pipeline.
Проанализируете покупки клиентов в ретейл-сети. Разработаете модель, которая поможет маркетологам запускать эффективные акции
9
1 проект・1 неделя
Второй большой проект
Разработаете 2 модели машинного обучения и оцените их качество. Упакуете работу в пайплайн. Смоделируете коэффициент удовлетворённости сотрудников, чтобы помочь HR-отделу компании спрогнозировать текучку кадров.
10
5 тем・1 проект・2 недели
Машинное обучение в бизнесе
  • Связь продуктовых метрик и МО
  • Доверительный интервал для A/B-теста
  • Применение бутстрепа
  • Разметка данных
  • Декомпозиция задачи
Метрики бизнеса
Оборот, себестоимость и маржинальность. Операционные расходы и операционная прибыль. Чистая прибыль. Возврат на инвестиции. Конверсии. Воронки. Онлайн- и офлайн-метрики.
Бутстреп в машинном обучении
А/B-тест. Расчёт доверительного интервала. Бутстреп и его применение.
Сбор данных
Источники данных. Разметка данных. Декомпозиция задачи. Голосование по большинству.
Обучите модель и предскажете, в каком месторождении добыча нефти принесёт наибольшую прибыль
11
7 тем・1 проект・3 недели
Базовый SQL
  • SQL
  • Базы данных
  • СУБД
  • PostgreSQL
  • SQL-запросы
  • Фильтрация данных
  • Группировка данных
  • Сортировка данных
  • Объединение таблиц
  • Подзапросы
  • Общие табличные выражения
  • Оконные функции
  • PySpark
Базы данных
База данных, СУБД, синтаксис языка SQL.
Срезы данных
ER-диаграмма. Логические и специальные операторы в SQL. Операторы работы с датой и временем. Обработка специальных значений. Условные конструкции в SQL-запросах.
Группировка и сортировка
Агрегирующие функции и их применение. Группировка данных. Сортировка данных. Группировка и сортировка по нескольким полям. Операторы HAVING, GROUP BY.
Связи и объединения таблиц
ER-диаграммы. Псевдонимы. Виды объединения таблиц. Оператор JOIN. Оператор INNER JOIN. Операторы LEFT OUTER JOIN и RIGHT OUTER JOIN. Оператор FULL OUTER JOIN. Виды присоединения: UNION и UNION ALL.
Подзапросы
Общие табличные выражения. Различие между подзапросом и присоединением. Работа со строками в PostgreSQL.
Схемы данных
Определение оконной функции. Определение и работа с окном. Особенности работы с оконными функциями. Операторы ранжирования. Расчёт кумулятивных функций. Операторы смещения.
PySpark
Распределённые системы. Структуры данных в PySpark. SQL-запросы в PySpark. RDD-датафреймы и работа с ними.
Напишете ряд запросов разной сложности к базе данных, в которой хранится информация о венчурных инвесторах, стартапах и инвестициях в них
12
5 тем・1 проект・1 неделя
Численные методы
  • Вычислительная сложность
  • Обучение нейросетей
  • Градиентный спуск
  • Градиентный бустинг
  • Функция потерь
Анализ алгоритмов
Вычислительная сложность. Время обучения линейной регрессии. Итеративные методы. Сравнение методов.
Градиентный спуск
Методы оптимизации. Функция потерь. Градиент функции. Градиентный спуск. Градиентный спуск для линейной регрессии. Стохастический градиентный спуск.
Градиентный бустинг
Ансамблевые методы. Градиентный бустинг. Регуляризация градиентного бустинга.
Разработаете модель для определения стоимости автомобиля с пробегом
13
3 темы・1 проект・1 неделя
Временные ряды
  • Анализ временных рядов
  • Прогнозирование временных рядов
  • Задача регрессии
Анализ временных рядов
Временные ряды. Ресемплирование. Скользящее среднее. Тренды и сезонность. Стационарные ряды. Разности временного ряда.
Прогнозирование временных рядов
Задача прогнозирования. Качество прогноза. Создание признаков. Обучение модели.
Построите модель и спрогнозируете пиковые нагрузки в такси
14
3 темы・1 проект・2 недели
Машинное обучение для текстов
  • Векторизация слов
  • Лемматизация
  • Эмбеддинги
  • Задача классификации
  • Задача регрессии
  • Word2vec
  • BERT
  • TF-ID
Векторизация слов
Лемматизация. Регулярные выражения. Векторизация слова. TF-ID.
Языковые представления
Эмбединги. Word2vec. BERT.
Ускорите модерацию комментариев в сообществе, автоматизировав оценку их токсичности
15
3 темы・1 проект・2 недели
Компьютерное зрение
  • Полносвязные сети
  • Свёрточные нейросети
  • Keras
  • LeNet
  • ResNet
  • Adam
Компьютерное зрение
Преобразование изображения в вектор. Аугментация. Классификация изображений.
Полносвязные сети
Полносвязные нейросети. Keras. Обучение нейронных сетей. Многослойные сети.
Свёрточные нейросети
Свёрточные слои. Свёрточные сети. LeNet. ResNet. Загрузчики данных. Adam.
Построите модель для определения приблизительного возраста человека по фотографии
16
3 темы・1 неделя
Обучение без учителя
Освоите ещё один способ машинного обучения, при котором система решает задачу без размеченных заранее данных, на основе их особенностей и структуры. Познакомитесь с задачами кластеризации и поиска аномалий.
17
1 проект・2 недели
Итоговый проект
Подтвердите, что освоили новую профессию. Уточните задачу заказчика, пройдёте все стадии анализа данных и машинного обучения. Теперь без уроков и домашних заданий — всё как на реальной работе.

Будете работать над одним из проектов на выбор:
· Прогноз оттока клиентов в телекоммуникационной компании.
· Предсказание параметров технологического процесса на металлургическом комбинате.
18
Самостоятельно・В любое время
Дополнительный курс: практика Python
Потренируетесь составлять запросы для получения данных. Самостоятельно составите датасет и обучите на нём модель. Оцените потенциальную опасность поездок для сервиса каршеринга и его клиентов.
19
Самостоятельно・В любое время
Дополнительный курс: теория вероятностей
Вспомните или узнаете базовые термины в теории вероятностей: независимые, противоположные, несовместные события и т. д. На простых примерах и забавных задачах потренируетесь работать с числами и выстраивать логику решения. Поработаете с практическими заданиями, которые используются на собеседованиях.
20
Самостоятельно・В любое время
Дополнительный курс: практика SQL
Решите несколько десятков дополнительных задач на отработку навыка работы с SQL. Пройдёте практические задания по составлению SQL-запросов, поработаете с новыми базами данных.

Отвечаем на вопросы

Подойдёт ли мне эта профессия?
Для тех, кто сомневается, мы спроектировали бесплатную часть курса по Data Science для начинающих с нуля, которая поможет получить ответ на этот вопрос. Если вы убедитесь, что выбранная профессия вам не подходит, — это тоже положительный результат.
Можно ли обучиться профессии за 8,5 месяцев?
Думаем, что да, если вы будете уделять занятиям не менее 20 часов в неделю, выполнять домашние задания и общаться с вашим наставником. Тогда за 8 месяцев вы сможете освоить навыки специалиста по Data Science, соберёте портфолио проектов и начнёте свой путь в профессию.
Каким требованиям нужно соответствовать?
Вам не понадобятся специальные навыки или опыт — на курсе «Специалист по Data Science» мы обучим всему с нуля. Главное — иметь компьютер и достаточно времени для занятий. Выше можно посмотреть программу, чтобы оценить количество учебного материала и свои возможности.
Подробнее о профессии Data Scientist вы можете узнать из нашей статьи.
Кто будет меня учить?
Все наставники — практикующие специалисты: сотрудники Яндекса и других крупных компаний. Программу составляют опытные преподаватели и методисты, а ещё действующие специалисты Яндекса, Школы анализа данных и других лидеров технологической и образовательной индустрий.
Как и когда я буду учиться?
Обучение состоит из 3 больших частей: теории с закреплением в тренажёре, домашних заданий с самостоятельными проектами и вебинаров с наставниками и экспертами из индустрии.

Теория в тренажёре и домашние задания не привязаны к расписанию — можно учиться когда угодно. Главное — уложиться в дедлайн, обычно это спринт из 2 недель. Вебинары проходят в определённое время, о котором вам заранее скажет куратор.
Что делать, если я не справлюсь с нагрузкой?
В программе предусмотрены каникулы, во время которых можно отдохнуть или повторить сложные темы.

Если вам понадобится сделать паузу в учёбе или уделить больше времени закреплению материала, напишите своему куратору.
Смогу ли я найти работу после обучения?
Гарантий нет, но мы верим, что сможете. Работодателям важно, чтобы вы справлялись с реальными задачами, а не просто обладали набором знаний. Мы учим применять знания на практике, а также предлагаем помощь HR-специалистов из нашего карьерного центра. Но вам точно придётся приложить усилия, чтобы найти работу: активно откликаться на вакансии, проходить собеседования, показывать свои проекты и делать тестовые задания.

По данным исследования Высшей школы экономики, 69% наших выпускников среди тех, кто хотел сменить профессию, начинают новую карьеру после обучения. Больше половины из них — во время учёбы и в первые 2 месяца после выпуска. Эти цифры подкреплены публичным отчётом о трудоустройстве студентов Практикума.
А если я хочу работать в Яндексе?
Некоторые наши студенты работают в сервисах Яндекса, в том числе и в Практикуме. Но с нашей стороны было бы нечестно что-либо гарантировать и завышать ваши ожидания.

Без опыта попасть в крупную IT-компанию возможно, хотя и сложно. Программа составлена так, чтобы вы могли начать карьеру после выпуска и набраться первого опыта. С ним вам будет значительно проще претендовать на позицию в крупных компаниях.
Хорошо, а вы можете помочь с поиском работы?
Да. По желанию студенты могут попасть на программу трудоустройства, которая длится от 2 недель. С поддержкой карьерного центра Практикума студенты оформляют портфолио, проходят тренировочные собеседования с их последующим разбором и учатся писать сопроводительные письма.

Мы сотрудничаем с разными компаниями и регулярно предлагаем студентам партнёрские вакансии. Но важно помнить, что мы не ищем работу за вас, а помогаем её найти.
Если не понравится, я могу вернуть деньги?
Да, причём в любой момент. Если обучение в потоке уже началось, придётся оплатить прошедшие дни — но мы вернём деньги за оставшееся время обучения. Более подробно рассказываем об этом в седьмом пункте оферты.
Получу ли я какой-то документ после курса?
Если у вас есть среднее профессиональное или высшее образование, после курса вы получите диплом о профессиональной переподготовке.

Если нет, выдадим сертификат о прохождении курса и справку об обучении в электронном виде.
Как можно оплатить?
Банковской картой: внести всю сумму сразу или платить ежемесячно.

Ежемесячные платежи работают так: вы вносите первую оплату, и в этот момент привязывается карта. С этой карты автоматически будут списываться следующие платежи каждые 30 календарных дней. Например, оплатили 25 марта — следующий платёж пройдёт 24 апреля. Обучение будет стоить меньше, если оплатить весь курс сразу.

Через компанию: юридические лица — резиденты РФ также могут оплатить обучение в Практикуме. Оставить заявку на оплату от юрлица можно на странице для корпоративных клиентов.
Можно ли оплатить курс за счёт работодателя?
Да, работодатель может оплатить учёбу полностью или разделить оплату с вами: например, поделить сумму 50/50 или 75/25.

Такая оплата пройдёт по счёту или двустороннему договору, а ИП могут оплатить с бизнес-счёта. Если работодатель купит обучение сразу 10 и больше сотрудникам, сделаем скидку 10%.

Чтобы получить счёт на оплату через компанию, оставьте заявку или напишите нам в чат поддержки.
Что такое налоговый вычет на обучение и как его получить?
Налоговый вычет может оформить тот, кто работает по трудовому договору и является налоговым резидентом Российской Федерации, то есть 183 дня в году находится на территории страны.

Для этого нужно подать заявление на налоговый вычет через личный кабинет на сайте nalog.ru (в него можно войти через аккаунт на Госуслугах).

К заявлению нужно приложить:
•‎ Справку 2-НДФЛ от работодателя.
•‎ Договор на обучение, в вашем случае это оферта Практикума.
•‎ Лицензию на образовательную деятельность. Вот наша.
•‎ Чек об оплате обучения. Мы отправляем его на электронную почту. Если не найдёте чек у себя в почте, напишите в чат службы поддержки — вышлем копию.
•‎ Справку о получении образовательных услуг — её тоже нужно запросить в чате поддержки.

Подробнее о налоговом вычете — на сайте Федеральной налоговой службы.

Давайте поможем

Мы перезваниваем в течение 30 минут каждый день с 10:00 до 19:00. Если оставите заявку сейчас, то перезвоним уже в рабочее время.