RDD（ResilientDistributedDataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合

题目

参考答案和解析

正确答案:正确

更多“RDD（ResilientDistributedDataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合”相关问题

第1题

spark中以下哪些特性是rdd的特性（）A、计算移动B、数据不移动C、数据移动D、计算不移动

点击查看答案
第2题

spark中的弹性分布式数据集相当于java中的（）概念A、类B、接口C、方法D、内部类

点击查看答案
第3题

创建rdd可以有如下几种？（）A、由外部存储系统的数据集创建，包括本地的文件系统B、由一个已经存在的Scala集合创建C、比如所有Hadoop支持的数据集，比如HDFS、Cassandra、HbaseD、以上说法都不对

点击查看答案
第4题

spark的源码是由哪几种语言编写完成的（）A、acheSpark是一种快速、通用、可扩展的大数据分析引擎B、spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理分布式数据集C、spark强调一站式解决方案，集批处理、实时流处理、交互式查询与图计算于一体，避免了多种运算场景下需要部署不同集群带来的资源浪费D、spark可以将数据分析过程的中间输出保存在内存中，从而不需要从外部持久化存储中反复读写数据，相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景

点击查看答案
第5题

与RDD类似，DataFrame也是一个分布式数据容器

点击查看答案
第6题

RDD特性包含如下哪些？（）A、一组分片（Partition），即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表，存储存取每个Partition的优先位置（preferredlocation）

点击查看答案
第7题

DiscretizedStream是SparkStreaming的基础抽象，代表持续性的数据流和经过各种Spark原语操作后的结果数据流

点击查看答案

大数据智能办公系统知识

RDD（ResilientDistributedDataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合

题目

参考答案和解析

更多“RDD（ResilientDistributedDataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合”相关问题

第1题

第2题

第3题

第4题

第5题

第6题

第7题

相关内容