判断题
决策树学习主要利用信息论中的信息增益(information gain),寻找数据集中有最大信息量的变量,建立数据的一个节点,再根据变量的不同值建立树的分枝,每个分枝子集中重复建树的下层结果和分枝的过程,一直到完成建立整株决策树。
正确
判断题 决策树过拟合时,先剪枝和后剪枝的效果和计算量完全一样,因此可以随意选择。
判断题 数据处理是讲信息转换成数据的过程。
判断题 数据量足够大时,增加或删除一些变量对最终的聚类结果不会有太大影响。