东财《数据挖掘概论》单元作业二
试卷总分:100 得分:100
一、单选题 (共 10 道试题,共 50 分)
1.可以用于阐明数据质量的要素中,不包括( )。
A.特殊性
B.准确性
C.完整性
D.一致性
2.以下选项中,属于监督的离散化技术的是( )。
A.直方图分析
B.分箱
C.决策树分析
D.K-means
3.规范化、数据离散化和概念分层产生都是某种形式的( )。
A.数据清理
B.数据集成
C.数据删除
D.数据变换
4.( )可以通过如聚集、删除冗余特征或聚类来降低数据的规模。
A.数据集成
B.数据归约
C.数据变换
D.数据清理
5.对于以下项集:{A,B};{A,C,D,E};{B,C,D,F};{A,B,C,D},{A,B,C,F}。其中,{A,B,C}的支持度为( )。
A.0
B.1/5
C.2/5
D.3/5
6.下面属于维归约常用的线性代数技术的是( )。
A.特征提取
B.主成分分析
C.特征加权
D.离散化
7.购物篮子分析是数据挖掘中( )任务的典型例子。
A.频繁项集挖掘
B.分类和预测
C.数据预处理
D.数据流挖掘
8.不包含任何频繁k项集的事务不可能包含任何频繁( )项集。
A.k
B.k-1
C.k+1
D.k-2
9.数据变换策略中,( )可以由给定属性构造新的属性并添加到属性集中,以帮助挖掘过程。
A.光滑
B.属性构造
C.聚集
D.规范化
10.( )将数据由多个数据源合并成一个一致的数据存储,如数据仓库。
A.数据集成
B.数据归约
C.数据变换
D.数据清理
二、多选题 (共 5 道试题,共 25 分)
11.以下属于频繁项集挖掘方法的有( )。
A.Apriori算法奥鹏作业答案请进open5.net或请联系QQ/微信:18866732
B.频繁模式增长
C.聚类
D.分类
12.关联规则的基本框架有( )。
A.支持度
B.提升度
C.置信度
D.卡方分析
13.以下属于挖掘频繁模式评估度量方法的有( )。
A.全置信度
B.最大置信度
C.Kulczynski
D.余弦
14.以下可能导致数据偏差的因素有( )。
A.过时的地址
B.故意错填个人信息
C.设计糟糕的输入表单
D.数据输入错误
15.维归约作为数据归约的主要策略,其具体技术包括( )。
A.参数方法
B.小波变换
C.主成分分析
D.属性子集选择
三、判断题 (共 5 道试题,共 25 分)
16.通过为找候选项集划分数据可以提高Apriori算法的效率。( )
17.频繁项集的所有非空子集也一定是频繁的。( )
18.聚类、决策树和相关分析可以用于数据离散化。( )
19.分箱使用类信息,因此是一种有监督的离散化技术。( )
20.提升度不受零事务数量影响。(
转载请注明:奥鹏作业之家 » 【奥鹏】22年春东财《数据挖掘概论》单元作业二