Если вы решили работать с большими данными в облаке, то привычный Hadoop — не лучшее решение. Архитектура этого инструмента не заточена под работу в облаках. Альтернативный вариант — запуск Apache Spark в Kubernetes. На вебинаре 5 декабря 2023 года будут рассмотрены возможности, ограничения и специфические особенности эксплуатации популярного инструмента обработки данных Apache Spark, развёрнутого на базе Kubernetes. Приглашаются дата- и ML-инженеры, тимлиды и руководители платформ данных, а также специалисты из команд DWH. Для участия в мероприятии необходимо зарегистрироваться по ссылке.
Что будет на вебинаре:
- Настроят и запустят первое Spark-приложение в Kubernetes.
- Рассмотрят различные сценарии запуска кода, в том числе с использованием S3.
- Разберут основные методы отладки, поиска ошибок и работы с логами.
- Ответят на вопросы.