Zeppelin中最核心的概念是Interpreter,interpreter是一个插件,允许用户使用一个指定的语言或数据处理器。
在右上角打开Interpreter:
在最下面看到Spark Interpreter
,里面有spark的一些默认参数:
例如默认提交模式是client,默认appname是Zeppelin(在spark history server里可以确认):
新建一个spark类型的notebook:
创建完成后,在里面执行SQL命令:
当执行select
时,看到有一个spark job正在跑:
执行完成后的结果:
Zeppelin中的Spark Notebook强大的地方在于对返回的数据进行各种可视化的能力,例如柱状图和饼图”
在柱状图里,能自定义各种筛选条件来创建对应的图表, 支持group by逻辑以及各种聚合(sum, count, min, max):