判断题
Sqoop数据导出的时间不取决数据量,一般都是固定时长。
错误(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)
判断题 部署Spark高可用集群不需要用到Zookeeper服务。
判断题 Pipeline被设计用来管理一系列的阶段,每一个阶段都由PipelineStage来表示。
判断题 在Spark SQL中,可以利用反射机制来推断包含特定类型对象的Schema,从而将已知数据结构的RDD转换成DataFrame。