“微信扫一扫”进入题库练习及模拟考试
把一组数据按照差异性和相似性分为几个类别,使得同类的数据相似性尽量大,不同类的数据相似性尽可能小,跨类的数据关联性尽可能低的是( )。
A.分类
B.回归
C.聚类分析
D.降维
参考答案:C
解析:
本题考查数据挖掘。
聚类就是把一组数据按照差异性和相似性分为几个类别,使得同类的数据相似性尽量大,不同类的数据相似性尽可能小,跨类的数据关联性尽可能低。C选项正确,ABD选项与题意无关。C正确。
【思路点拨】注意区分这几个选项,避免混淆。
分类:通过特征变量确定观测单位所属的类别,因变量是分类变量。
回归:通过特征变量确定观测单位因变量的取值,因变量是定量变量。
降维:也称为特征提取,指在不损失过多信息的前提下将N个相关的特征降为k个不相关的特征(其中 k<N) 使其具有更好的解释性。