Spark SQL是Apache Spark的一个组件,提供了一种用于处理结构化数据的统一接口。它可以直接支持SQL查询,还能在Spark程序中使用DataFrame和DataSet API进行数据处理。本章将介绍如何使用Spark SQL-shell来操作和处理数据。