《大数据计算技术Ⅱ》课程在线作业1
试卷总分:100 得分:100
一、单选题 (共 5 道试题,共 25 分)
1.下列哪一个大数据衡量单位最大:
A.EB
B.ZB
C.PB
D.TB
2.下列哪一个大数据属性是用来衡量价值的:
A.volume
B.Variety
C.Velocity
D.Value
3.下列不属于大数据计算体系三个基本层次的:
A.数据存储系统
B.数据处理系统
C.数据应用系统
D.数据传输系统
4.下列不属于NOSQL数据库的是:
A.SQL数据库
B.列存储数据库
C.文档数据库
D.图形数据库
5.下列不属于大数据开源技术解决方案的
A.HDFS
B.Hbase
C.MapReduce
D.Colossus
二、多选题 (共 2 道试题,共 10 分)
6.下列属于数据处理算法的
A.回归分析
B.聚类算法
C.关联规则算法
D.排序算法
7.下列属于缺失值处理方法的是:
A.忽略该记录
B.使用默认值
C.使用同类样本平均值
D.随机产生缺失值的补充
三、判断题 (共 13 道试题,共 65 分)
8.ICDM会议评选的十大经典算法包括C4.5算法、k-均值算法、支持向量机、Apriori算法、EM算法、PageRank算法、AdaBoost算法、k-临近算法、朴素贝叶斯算法和回归树算法。
9.读取CSV文件不可以采用读取txt文件的函数
10.ndarray对象的属性包括数组轴的个数
11.DataFrame每一列必须都是类型相同的值
12.Hadoop基于HDFS/HBase的数据存储系统
13.一个HDFS文件可以按Split形式进行物理存储
14.KNN算法无需通过学习得到决策函数。奥鹏作业答案请进open5.net或请联系QQ/微信:18866732
15.PageRank用来解决链接分析中网页排名的问题
16.读取文本常用函数包括write
17.要把数据写入txt文件,必须创建file对象
18.连接数据库时需要设置服务器的名称
19.连接数据库时需要设置服务器的地址
20.merge默认对数据表进行内连接
转载请注明:奥鹏作业之家 » 【奥鹏】电科23春学期《大数据计算技术Ⅱ》课程在线作业1