树模型(tree-based model),理学-统计学-大数据统计分析-数据类型,通过把特征空间(即变量空间)分割成一些矩形空间,然后在每一个空间中拟合一个简单模型,从而进行预测的一种机器学习算法。简史针对决策树分类算法,1986年出现了著名的ID3算法;在ID3算法的基础上,为了在树构造过程中进行剪枝,并且能够完成对连续属性的离散化处理,1993年学者们又提出了C4.5算法;之后随着数据量的上升,SLIQ算法利用预排序和广度优先策略从而能够处理比C4.5算法大得多的数据集。SPRINT算法为了减少驻留于内存的数据量,进一步对上面的算法进行了改进,从而在寻找每个节点的最优分裂标准时变得更简单。为了统一回归树和分类树,1991年产生了一种新算法——分类回归树法(classification and regression tree;CART),该算法基于非参数的思想对参数模型进行建模。