AWS上的Spark产品

Glue

  • 全托管的Serverless Spark,可以做图形化的ETL

  • 适合小型的、Event-driven的任务

EMR

  • 托管的YARN及Hadoop
  • 适合大规模的、长期跑的作业任务
  • EMR同时有EMR Serverless和EMR on EKS