23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《大数据开发技术(一)》在线作业-00002
试卷总分:100 得分:100
一、单选题 (共 30 道试题,共 60 分)
1.关于Storm中Topology说法错误的是()。
A.Topology可视为流转换图
B.Topology可以被提交到Storm集群执行
C.在Topology里面可以指定每个组件的并行度, Storm会在集群里面分配那么多的线程来同时计算
D.Topology里面的每一个组件都是串行运行的
2.Leaflet是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
3.Google Chart API是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
4.Weka是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
5.Hbase中Zookeeper文件记录了()的位置
A..META.表
B.-ROOT-表
C.Region
D.Master
6.优点是查找速度快,可扩展性强,容易进行分布式扩展,复杂性低的数据库是()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
7.SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层
A.Client Layer
B.Services Layer
C.Platform Layer
D.Infrastructure Layer
8.NoSQL中的CAP理论中的P代表()
A.一致性
B.可用性
C.分区容忍性
D.可扩展性
9.UMP系统中面对分库分表用户如何进行资源调度()
A.可以共享同一个MySQL实例
B.每个用户独占一个MySQL实例
C.会占用多个独立的MySQL实例
D.随机分配MySQL实例
10.信息技术发展史上的第三次信息化浪潮解决的问题是什么()。
A.信息处理
B.信息增长
C.信息爆炸
D.信息传输
11.hadoop fs -() 命令可以将指定的文件的内容输出到标准输出
A.cat
B.append
C.add
D.write
12.Hadoop中执行MapReduce任务不含哪种方式()。
A.Mahout
B.Hadoop jar
C.Shell脚本
D.Python
13.应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
14.Echarts是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
15.MapReduce中最优的Reduce任务个数取决于集群中可用的()的数目。
A.Split
B.Slot
C.Map
D.Shuffle
16.优点是扩展性好,灵活性好,大量写操作时性能高的数据库是()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
17.UMP系统借助于()来实现高效和可靠的协同工作
A.Mnesia
B.LVS
C.RabbitMQ
D.Zookeeper
18.对于不同顶点之间的信息交换,Pregel采用了()
A.远程数据读取
B.共享内存
C.纯消息传递模型
D.共享消息
19.Hbase中客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的()位置信息,用来加快后续数据访问过程
A.Master
B.Slaver
C.Region
D.客户端
20.流数据采取()计算模式
A.批量
B.实时
C.大数据
D.动态
21.应用于存储、索引并管理面向文档的数据或者类似的半结构化数据,比如,用于后台具有大量读写操作的网站的数据库是哪种()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
22.Amazon RDS属于()
A.关系数据库
B.键值数据库
C.NoSQL数据库
D.数据仓库
23.优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
24.Hbase中采用()保证系统出错时及时恢复
A.MemStore
B.Hlog
C.StoreFile
D.客户端
25.Google Cloud SQL是谷歌公司推出的基于()的云数据库
A.MySQL
B.SQL Server
C.Hbase
D.Oracle
26.针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
A.Time Tunnel
B.Spark
C.Super Mario
D.Storm
27.HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量()冗余因子
A.大于
B.小于
C.等于
D.大于等于
28.NoSQL中的CAP理论中的A代表()
A.一致性
B.可用性
C.分区容忍性
D.可扩展性
奥鹏作业答案请进open5.net或请联系QQ/微信:18866732
29.Pregel计算模型以()作为输入
A.有向图
B.无向图
C.矢量图
D.树
30.HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
A.垂直扩展
B.水平扩展
C.拓扑扩展
D.叠加
二、多选题 (共 10 道试题,共 20 分)
31.以下哪些是云计算关键技术()。
A.虚拟化
B.分布式计算
C.分布式存储
D.物联网
E.单租户
32.以下哪种数据库适合于小批量的数据处理()
A.Oracle
B.NosSQL
C.MySQL
D.Hbase
33.HDFS要实现的目标
A.流数据读写
B.大数据集的操作
C.复杂的文件模型
D.强大的跨平台兼容性
34.以下哪个是HDFS的局限性()。
A.延迟高
B.只允许对文件执行追加操作,不能执行随机写操作
C.用MapReduce处理大量小文件时,会产生过多的Map任务,线程管理开销会大大增加
D.拥有复杂的数据模型
35.Hbase中Zookeeper提供了()
A.分布式同步
B.组服务
C.域名服务
D.配置维护
36.以下属于Hadoop的安装方式的有()。
A.单机模式
B.多机模式
C.分布式模式
D.并行模式
E.伪分布式模式
37.关系数据库与NoSQL数据库相比有哪些优势()
A.支持事务ACID四性
B.可以支持超大规模数据存储
C.以完善的关系代数理论作为基础
D.具有强大的横向扩展能力
38.以下亚马逊的产品中哪个属于计算部分
A.EC2
B.EBS
C.S3
D.ELB
39.Hbase系统结构中包括()
A.Zookeeper服务器
B.客户端
C.Master服务器
D.Region服务器
40.Hadoop配置文件中说法错误的是()。
A.core-site.xml中hadoop.tmp.dir表示存放临时数据的目录,仅为NameNode的数据
B.core-site.xml中fs.defaultFS表示HDFS路径的逻辑名称
C.hdfs-site.xml中dfs.namenode.name.dir表示存储fsimage文件的地方
D.hdfs-site.xml中dfs.replication表示副本的数量,伪分布式要设置为0
E.hdfs-site.xml中dfs.datanode.data.dir表示HDFS数据存放block的地方
三、判断题 (共 10 道试题,共 20 分)
41.HDFS只允许一个文件有一个写入者,不允许多个用户对同一个文件执行写操作
42.Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。
43.Hbase中每个Region 使用一个Hlog
44.Hbase和传统数据库一样都是列式数据库
45.MapReduce和Spark都属于大数据批处理计算的产品。
46.Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储
47.HDFS 在设计上采取了多种机制保证在硬件出错的环境中实现数据的完整性。
48.”hadoop dfs”和”hdfs dfs”两条命令都只是用于HDFS文件系统
49.大数据开发的两大核心技术是Hadoop和MapReduce
50.阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等
转载请注明:奥鹏作业之家 » 南开23春学期《大数据开发技术(一)》在线作业【参考答案】