五、Spark on k8s 如何运行
首先 Spark 有一个客户端,客户端会构建好 driver pod 对象,向 K8s 的 apiserver 发送请求,去创建 driver pod,Spark 的 driver 进程运行在 driver pod 当中。Spark driver 启动之后,会在 driver 内构建 executor pod 的对象,创建 executor pod,并持续 watch and list 去监听每一个 executor pod 的状态。当任务运行结束的时候,executor pod 会被清理,driver pod 会继续以 completed 的状态存在。这就是 Spark on K8s 的运行过程。