判断题
部署Spark高可用集群不需要用到Zookeeper服务。
错误(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)
判断题 Pipeline被设计用来管理一系列的阶段,每一个阶段都由PipelineStage来表示。
判断题 在Spark SQL中,可以利用反射机制来推断包含特定类型对象的Schema,从而将已知数据结构的RDD转换成DataFrame。
判断题 在Spark SQL中,若想要使用SQL风格操作,则需要提前将DataFrame注册成一张临时表。