Zeppelin

Apache Zeppelin 是一款基于 Web 的 Notebook 产品,能够交互式数据分析。使用 Zeppelin可以使用丰富的预构建语言后端(或解释器)制作交互式的协作文档,例如 Scala(Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、Shell 等。

Zeppelin基于Jetty Server,使用Intepreter与各种服务进行交互:

image-20240217081520499

登录到Zeppelin

Zeppelin使用8890端口暴露服务,所以要在EMR Primary节点的安全组上,把本机IP放开:

image-20230203082704845

访问Primary节点IP的8890端口:

image-20230203082804850

创建新的Note:

image-20240217062138853

选择spark类型的Note,除了spark外,还有以下类型:

image-20240217062217015