Apache Zeppelin 是一款基于 Web 的 Notebook 产品,能够交互式数据分析。使用 Zeppelin可以使用丰富的预构建语言后端(或解释器)制作交互式的协作文档,例如 Scala(Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、Shell
等。
Zeppelin基于Jetty Server,使用Intepreter与各种服务进行交互:
Zeppelin使用8890端口暴露服务,所以要在EMR Primary节点的安全组上,把本机IP放开:
访问Primary节点IP的8890端口:
创建新的Note:
选择spark类型的Note,除了spark外,还有以下类型: