东财《数据挖掘概论》单元作业二
试卷总分:100 得分:100
一、单选题 (共 10 道试题,共 50 分)
1.以下选项中,属于监督的离散化技术的是( )。
A.直方图分析
B.分箱
C.决策树分析
D.K-means
2.规范化、数据离散化和概念分层产生都是某种形式的( )。
A.数据清理
B.数据集成
C.数据删除
D.数据变换
3.( )可以通过如聚集、删除冗余特征或聚类来降低数据的规模。
A.数据集成
B.数据归约
C.数据变换
D.数据清理
4.提升度的值小于1,表明两个项之间的相关关系为( )。
A.正相关
B.置信度
C.不相关
D.不确定
5.下面购物篮能够提取的3-项集的最大数量是( )ID购买项1牛奶,啤酒,尿布2面包,黄油,牛奶3牛奶,尿布,饼干4面包,黄油,饼干5啤酒,饼干,尿布6牛奶,尿布,面包,黄油7面包,黄油,尿布8啤酒,尿布9牛奶,尿布,面包,黄油10啤酒,饼干。
A.1
B.2
C.3
D.4
6.Kulc度量的值越( ),A和B的联系越紧密。
A.大
B.小
C.不变
D.零
7.Apriori算法使用一种称为逐层搜索的迭代方法,其中k项集用于探索( )项集。
A.k
B.k+1
C.k+2
D.k-1
8.设X={1,2,3,4}是频繁项集,则可由X产生( )个关联规则。
A.12
B.13
C.14
D.16
9.如果使用神经网络后向传播算法进行分类挖掘,对训练元组中每个属性的输入值进行( ),将有助于加快学习阶段的速度。
A.光滑
B.属性构造
C.聚集
D.规范化
10.数据变换策略中,把属性数据按比例缩放,使之落入一个特定的小区间的策略称为( )。
A.光滑
B.属性构造
C.聚集
D.规范化
二、多选题 (共 5 道试题,共 25 分)
11.以下属于频繁项集挖掘方法的有( )。
A.Apriori算法
B.频繁模式增长
C.聚类
D.分类
12.在以下的模式评估度量中属于零不变度量的有( )。
A.提升度
B.全置信度
C.最大置信度
D.余弦
13.关联规则的基本框架有( )。
A.支持度
B.提升度
C.置信度
D.卡方分析
14.PCA可以用于有序和无序的属性,并且可以更好地处理( )数据。
A.密集
B.高维
C.倾斜
D.稀疏
15.数据清理通过( )来“清理”数据。奥鹏作业答案请进open5.net或请联系QQ/微信:18866732
A.识别或删除离群点
B.光滑噪声数据
C.忽略缺失的值
D.解决不一致性来
三、判断题 (共 5 道试题,共 25 分)
16.通过为找候选项集划分数据可以提高Apriori算法的效率。( )
17.离散化不能用来处理噪声。( )
18.维归约和数量归约也可以看作是某种形式的数据压缩。( )
19.关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。( )
20.提升度不受零事务数量影响。( )
转载请注明:奥鹏作业之家 » 【奥鹏】21秋东财《数据挖掘概论》单元作业二