- 20.06.2022
- 23 848
- 218
- 36
- Награды
- 10
- Пол
- Муж.
Репутация:
- Автор темы
- Администратор
- Модератор
- Команда форума
- #1
Научитесь строить пайплайны данных в реальном времени.
В современных компаниях накапливается большой объем данных, из которых можно извлекать важную аналитику, строить гипотезы или модели прогнозирования. Data Engineer - это специалист, который собирает данные из разных источников, очищает их и передает в удобном виде аналитикам для принятия бизнес-решений.
Аналитикам данных нужно знать, как работает хранилище данных, в каком виде там хранятся данные, как они обрабатываются и как их можно получить для анализа.
Курс ориентирован на практику и основные инструменты, подходит для тех, кто имеет базовые знания языка Python. За два месяца вы освоите все важные этапы Data Engineering.
Программа курса
- 1 Введение, практический linux
- 2 Современные хранилища данных
- 3 Экосистема Hadoop
- 4 Источники данных и работа с ними
- 5 Apache Spark и обработка данных
- 6 Hadoop как хранилище данных
- 7 Apache Airflow для оркестрации конвейеров
- 8 Обзор облачных хранилищ
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.
Последние темы в этом разделе:
- [Институт Современного НЛП] Разговоры о страшном (2024)
- [Наташа Аристотелева] Курс по пилочному маникюру, пленкам и японскому покрытию (3 поток) (2024)
- [Дмитрий Новосёлов] Как написать книгу и начать зарабатывать пассивно (2024)
- [Мастерская Светланы Патрушевой] Мастер Слова (2023)
- [РУНО] Microsoft Excel 2016 - 2019. Уровень 1+2+3. От новичка до эксперта (2022)
- [Udemy] Живой баг-баунти и этический хакинг 2025 (2024)
- [Архэ] Как СМИ манипулируют людьми (2024)
- [lenathink] Горячие подписчики в Телеграм через Яндекс Директ (2024)
- [Ольга Крылова] ВПР по английскому языку в 2025 году 4, 5, 6, 7, 8, 10 класс (2024)
- [Дмитрий Румянцев] Системный SMM 2024. Тариф Система (2024)