打开AWS控制台,进入EMR页面
选择创建集群:
选择以下组件:
在Cluster termination部分,选择Manually termiate cluster
, 否则不使用的时候emr会自动terminate:
选择Keypair,service role
和instance profile
:
其他选项保持默认。点击创建集群,创建过程会持续十几分钟
在创建完成后,集群的状态将变为Waiting:
打开EMR控制台,找到JupyterHub地址, 并打开:-
选择信任证书并打开:
注意:chrome浏览器可能提示证书风险问题,加载不出该页面。如果出现这种情况,可以使用safari浏览器打开。
使用用户名jovyan和密码jupyter登录
登录成功后,创建一个新的PySpark Notebook: