判断题
决策树模型采用两种树枝修剪方法,分别是事前修剪方法和事后修剪方法。事前修剪方法,从一个“充分生长”树中,修剪掉多余的树枝(分支)。
错误(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)
判断题 数据分布的统计分析方法包括分箱、直方图分析、聚类分析、机遇熵的离散化和通过“自然划分”的数据分段等。
判断题 当数据集过大时,受数据挖掘算法的复杂度或空间复杂度的限制,需要对数据集抽样才能对其进行有效的分析处理,抽样的方式包括,随机抽样、分层抽样、等轴抽样法、整群抽样法、渐进抽样法。
判断题 数据理解包括理解数据的模式,理解数据的分布情况,确认数据质量。