《大数据计算技术Ⅱ》课程在线作业3
试卷总分:100 得分:100
一、单选题 (共 5 道试题,共 25 分)
1.下列不属于ODBC接口特征的:
A.用户直接将SQL语句传送给ODBC
B.对数据库的操作不依赖任何DBMS
C.不直接与DBMS打交道
D.由Java 语言编写的类和接口组成
2.下列哪一个大数据属性是用来衡量价值的:
A.volume
B.Variety
C.Velocity
D.Value
3.下列不属于大数据开源技术解决方案的
A.HDFS
B.Hbase
C.MapReduce
D.Colossus
4.下列哪一个大数据衡量单位最大:
A.EB
B.ZB
C.PB
D.TB
5.下列不属于列存储格式特征的:
A.基于主键存储
B.基于键值对存储
C.采用非关系型模型
D.查询效率优于按行存储
二、判断题 (共 13 道试题,共 65 分)
6.读取CSV文件不可以采用读取txt文件的函数
7.ICDM会议评选的十大经典算法包括C4.5算法、k-均值算法、支持向量机、Apriori算法、EM算法、PageRank算法、AdaBoost算法、k-临近算法、朴素贝叶斯算法和回归树算法。
8.Mayavi不但是一个方便实用的可视化软件,而且可以方便地用Python编写扩展
9.二次索引表机制的关键是建立主表列到RowKey的逆向映射关系
10.集群由多个独立的计算机通过高速局域网连接在一起
11.Hadoop基于HDFS/HBase的数据存储系统
12.Mapper执行map task,将输出结果写入中间文件
13.scikit-learn 是机器学习领域的一个商用库
14.自然语言处理的应用,包括语音识别,语音翻译,理解句意等
15.Matplotlib是为Java构建一个与Matlab之间进行交互的绘图接口
16.串行化计算模式是大数据计算模式之一
17.HDFS采用多副本方式进行冗余存储
18.HDFS提供了HBase的底层数据存储结构
三、多选题 (共 2 道试题,共 10 分)奥鹏作业答案请进open5.net或请联系QQ/微信:18866732
19.下列关于监督学习的描述,不正确的是
A.在监督学习中,输入变量与输出变量可以是连续的,也可以是离散的
B.在监督学习中,输入变量与输出变量只能是连续的
C.在监督学习中,输入变量与输出变量只能是离散的
D.若输入变量与输出变量均为连续变量,则称为分类
20.下列属于缺失值处理方法的是:
A.忽略该记录
B.使用默认值
C.使用同类样本平均值
D.随机产生缺失值的补充
转载请注明:奥鹏作业之家 » 【奥鹏】电科23春学期《大数据计算技术Ⅱ》课程在线作业3