题目内容
(请给出正确答案)
[单选题]
在spark中,以下关于dataframe描述,错误的是()
A.dataframe是指定列名称的dataset
B.dataframe提供详细的结构信息
C.dataframe不是面向对象的
D.dataframe在序列化与反序列化时,要对数据和数据结构进行序列化
答案
查看答案
A.dataframe是指定列名称的dataset
B.dataframe提供详细的结构信息
C.dataframe不是面向对象的
D.dataframe在序列化与反序列化时,要对数据和数据结构进行序列化
第1题
A.在Spark任务提交端,即应用服务器安装Spark即可
B.需要在集群各节点安装Spark才可以运行
C.不需在任何机器安装Spark
D.在NameNode上安装Spark
第3题
A.Hadoop
B.Impala
C.Spark
D.BigTable
第9题
A.RDD具有血统机制(Lineage)
B.RDD默认存储在磁盘
C.RDD是一个只读的,可分区的分布式数据集
D.RDD是Spark对基础数据的抽象