国开24春《大数据库管理 060602》第三次过程性考核作业（7~10单元）【参考答案】-奥鹏作业之家

单选题

1在Hadoop生态系统中，Kafka主要解决Hadoop 中存在哪些的问题？

A抽象层次低，需要手工编写大量代码

B延迟高，而且不适合执行迭代计算

CHadoop生态系统中各个组件和其他产品之间缺乏统一的、高效的数据交换中介

D不同的MapReduce任务之间存在重复操作，降低了效率

答案：C

2下列关于Spark中RDD的说法，描述有误的是？

A每个RDD可分成多个分区，每个分区就是一个数据集片段

B一个RDD就是一个分布式对象集合，本质上是一个只读的分区记录集合

CRDD提供了一种高度受限的共享内存模型

DRDD是可以直接修改的

答案：D

3下列哪个不属于YARN体系结构中ApplicationMaster的功能？

A处理来自ResourceManger的命令

B任务调度、监控与容错

C为应用程序申请资源

D将申请的资源分配给内部任务

答案：A

4关于HDFS Federation 的设计的描述，哪个是错误的？

A属于不同命名空间的块可以构成同一个“块池”

BHDFS的命名服务能够水平扩展

C设计了多个相互独立的名称节点

DHDFS Federation中，所有名称节点会共享底层的数据节点存储资源，数据节点向所有名称节点汇报

答案：A

5下列关于推荐系统的描述，有误的是？

A混合推荐：结合多种推荐算法来提升推荐效果

B基于统计的推荐：通过机器学习的方法去描述内容的特征，并基于内容的特征来发现与之相似的内容

C专家推荐：人工推荐，由资深的专业人士来进行物品的筛选和推荐，需要较多的人力成本性

D协同过滤推荐：应用最早和最为成功的推荐方法之一

答案：B

6MapReduce1.0的体系结构中，JobTracker的主要任务是什么？

A会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给TaskTracker

B使用“slot”等量划分本节点上的资源量（CPU、内存等）

C负责资源监控和作业调度，监控所有TaskTracker与Job的健康状况

D会跟踪任务的执行进度、资源使用量等信息，并将这些信息告诉任务（Task）

答案：

7下列关于Spark的描述，错误的是哪一项？

A支持使用Scala、Java、Python和R语言进行编程，但是不可以通过Spark Shell进行交互式编程

B可运行于独立的集群模式中，可运行于Hadoop中，也可运行于Amazon EC2等云环境中

C使用DAG执行引擎以支持循环数据流与内存计算

D提供了完整而强大的技术栈，包括SQL查询、流式计算、机器学习和图算法组件

答案：

8下列关于Map和Reduce函数的描述，哪个是错误的？

AMap将小数据集进一步解析成一批<key,value>对，输入Map函数中进行处理

BReduce输入的中间结果<k2,List(v2)>中的List(v2)表示是一批属于不同k2的value

CMap每一个输入的<k1,v1>会输出一批<k2,v2>，

DReduce输入的中间结果<k2,List(v2)>中的List(v2)表示是一批属于同一个k2的value

答案：

9下列关于Scala特性的描述，错误的是哪一项？

AScala是Spark的主要编程语言

BScala具备强大的并发性，支持函数式编程，可以更好地支持分布式系统

CScala语法复杂，但是能提供优雅的API

DScala兼容Java，运行速度快，且能融合到Hadoop生态圈中

答案：

10关于Spark运行架构，下列说法错误的是？

A一个Job包含多个RDD及作用于相应RDD上的各种操作

BApplication是用户编写的Spark应用程序

CRDD是运行在工作节点（WorkerNode）的一个进程，负责运行Task

DDAG反映RDD之间的依赖关系

答案：

11下列关于推荐系统的描述，哪一项是错误的？国开形考答案联系QQ/微信：18866732

A推荐系统是自动联系用户和物品的一种工具

B推荐系统可以创造全新的商业和经济模式，帮助实现长尾商品的销售

C推荐系统分为基于物品的协同过滤和基于商家的协同过滤

D推荐系统是大数据在互联网领域的典型应用

答案：

12下列传统并

转载请注明：奥鹏作业之家 » 国开24春《大数据库管理 060602》第三次过程性考核作业（7~10单元）【参考答案】

国开24春《大数据库管理 060602》第三次过程性考核作业（7~10单元）【参考答案】

与本文相关的文章

Hi，您需要填写昵称和邮箱！