在许多数据处理场景中,我们面临一个典型的架构窘境:需要Apache Spark的分布式计算能力来处理TB级的数据集,但整个项目的协调和调度需求又相对简单,引入Apache Airflow或Azkaban这类重型工作流引擎显得杀鸡用牛。这些引
2023-10-27