《大数据计算技术Ⅱ》课程在线作业2
试卷总分:100 得分:100
一、单选题 (共 4 道试题,共 20 分)
1.美国政府在哪一年推出“大数据的研究和发展计划”:
A.2010
B.2011
C.2012
D.2013
2.下列哪一个大数据属性是用来衡量价值的:
A.volume
B.Variety
C.Velocity
D.Value
3.下列不属于列存储格式特征的:
A.基于主键存储
B.基于键值对存储
C.采用非关系型模型
D.查询效率优于按行存储
4.下列不属于NOSQL数据库的是:
A.SQL数据库
B.列存储数据库
C.文档数据库
D.图形数据库
二、多选题 (共 3 道试题,共 15 分)
5.下列属于数据噪声处理方法的是:
A.分箱算法
B.平滑算法
C.聚类算法
D.回归算法
6.下列属于缺失值处理方法的是:
A.忽略该记录
B.使用默认值
C.使用同类样本平均值
D.随机产生缺失值的补充
7.下列关于监督学习的描述,不正确的是
A.在监督学习中,输入变量与输出变量可以是连续的,也可以是离散的
B.在监督学习中,输入变量与输出变量只能是连续的
C.在监督学习中,输入变量与输出变量只能是离散的
D.若输入变量与输出变量均为连续变量,则称为分类
三、判断题 (共 13 道试题,共 65 分)
8.merge默认对数据表进行内连接
9.读取CSV文件不可以采用读取txt文件的函数
10.replace方法不支持一次性替换多个值
11.DataFrame每一列必须都是类型相同的值
奥鹏作业答案请进open5.net或请联系QQ/微信:18866732
12.scikit-learn 是机器学习领域的一个商用库
13.HDFS提供了HBase的底层数据存储结构
14.join默认对数据表进行内连接
15.ndarray对象的属性包括数组轴的个数
16.在创建数组类型时,可以按照特定的格式进行显示
17.NumPy运算符dot函数是按元素相乘进行计算的
18.完全不拷贝可以简单地对数组进行赋值,而不需要拷贝数组对象的数据。
19.Pandas只能处理按照时间序列排列的数据
20.Mapper执行map task,将输出结果写入中间文件
转载请注明:奥鹏作业之家 » 【奥鹏】电科23春学期《大数据计算技术Ⅱ》课程在线作业2