最新消息:可做奥鹏等各院校作业论文,答案请联系QQ/微信:18866732

国开24春《大数据库管理 060602》第三次过程性考核作业(7~10单元)【参考答案】

单选题

1在Hadoop生态系统中,Kafka主要解决Hadoop 中存在哪些的问题?

A抽象层次低,需要手工编写大量代码

B延迟高,而且不适合执行迭代计算

CHadoop生态系统中各个组件和其他产品之间缺乏统一的、高效的数据交换中介

D不同的MapReduce任务之间存在重复操作,降低了效率

答案:C

2下列关于Spark中RDD的说法,描述有误的是?

A每个RDD可分成多个分区,每个分区就是一个数据集片段

B一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合

CRDD提供了一种高度受限的共享内存模型

DRDD是可以直接修改的

答案:D

3下列哪个不属于YARN体系结构中ApplicationMaster的功能?

A处理来自ResourceManger的命令

B任务调度、监控与容错

C为应用程序申请资源

D将申请的资源分配给内部任务

答案:A

4关于HDFS Federation 的设计的描述,哪个是错误的?

A属于不同命名空间的块可以构成同一个“块池”

BHDFS的命名服务能够水平扩展

C设计了多个相互独立的名称节点

DHDFS Federation中,所有名称节点会共享底层的数据节点存储资源,数据节点向所有名称节点汇报

答案:A

5下列关于推荐系统的描述,有误的是?

A混合推荐:结合多种推荐算法来提升推荐效果

B基于统计的推荐:通过机器学习的方法去描述内容的特征,并基于内容的特征来发现与之相似的内容

C专家推荐:人工推荐,由资深的专业人士来进行物品的筛选和推荐,需要较多的人力成本性

D协同过滤推荐:应用最早和最为成功的推荐方法之一

答案:B

6MapReduce1.0的体系结构中,JobTracker的主要任务是什么?

A会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给TaskTracker

B使用“slot”等量划分本节点上的资源量(CPU、内存等)

C负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况

D会跟踪任务的执行进度、资源使用量等信息,并将这些信息告诉任务(Task)

答案:

7下列关于Spark的描述,错误的是哪一项?

A支持使用Scala、Java、Python和R语言进行编程,但是不可以通过Spark Shell进行交互式编程

B可运行于独立的集群模式中,可运行于Hadoop中,也可运行于Amazon EC2等云环境中

C使用DAG执行引擎以支持循环数据流与内存计算

D提供了完整而强大的技术栈,包括SQL查询、流式计算、机器学习和图算法组件

答案:

8下列关于Map和Reduce函数的描述,哪个是错误的?

AMap将小数据集进一步解析成一批<key,value>对,输入Map函数中进行处理

BReduce输入的中间结果<k2,List(v2)>中的List(v2)表示是一批属于不同k2的value

CMap每一个输入的<k1,v1>会输出一批<k2,v2>,

DReduce输入的中间结果<k2,List(v2)>中的List(v2)表示是一批属于同一个k2的value

答案:

9下列关于Scala特性的描述,错误的是哪一项?

AScala是Spark的主要编程语言

BScala具备强大的并发性,支持函数式编程,可以更好地支持分布式系统

CScala语法复杂,但是能提供优雅的API

DScala兼容Java,运行速度快,且能融合到Hadoop生态圈中

答案:

10关于Spark运行架构,下列说法错误的是?

A一个Job包含多个RDD及作用于相应RDD上的各种操作

BApplication是用户编写的Spark应用程序

CRDD是运行在工作节点(WorkerNode)的一个进程,负责运行Task

DDAG反映RDD之间的依赖关系

答案:

11下列关于推荐系统的描述,哪一项是错误的?国开形考答案联系QQ/微信:18866732

A推荐系统是自动联系用户和物品的一种工具

B推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售

C推荐系统分为基于物品的协同过滤和基于商家的协同过滤

D推荐系统是大数据在互联网领域的典型应用

答案:

12下列传统并

转载请注明:奥鹏作业之家 » 国开24春《大数据库管理 060602》第三次过程性考核作业(7~10单元)【参考答案】

发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址