Spark Interpreter

查看Spark Interpreter

Zeppelin中最核心的概念是Interpreter,interpreter是一个插件,允许用户使用一个指定的语言或数据处理器。

在右上角打开Interpreter:

image-20240309215301140

在最下面看到Spark Interpreter,里面有spark的一些默认参数:

image-20240309215327086

例如默认提交模式是client,默认appname是Zeppelin(在spark history server里可以确认):

image-20240309220432344

创建spark notebook

新建一个spark类型的notebook:

image-20240309215342839

创建完成后,在里面执行SQL命令:

image-20240309220543392

当执行select时,看到有一个spark job正在跑:

image-20240309215509123

执行完成后的结果:

image-20240309220634531

Zeppelin中的Spark Notebook强大的地方在于对返回的数据进行各种可视化的能力,例如柱状图和饼图”

image-20240309215536593

在柱状图里,能自定义各种筛选条件来创建对应的图表, 支持group by逻辑以及各种聚合(sum, count, min, max):

image-20240309215722200