第一节创建mydb
数据库后,执行describe命令,看到它在HDFS的/user/spark/warehouse
目录下:
这个Warehouse目录是可以指定的,默认是在/etc/spark/conf/spark-defaults.conf
中配置:
在运行Spark SQL Shell时,也可以手动指定这个位置:
spark-sql --conf "spark.sql.warehouse.dir=hdfs://ip-172-31-32-28.us-west-2.compute.internal:8020/user/root/testdir/warehouse"
create database mydb3;
创建一个数据库mydb3
,它的位置已经变为上面设置的目录:
使用hdfs命令也可以确认:
hdfs dfs -ls /user/root/testdir/warehouse/