交通数据挖掘(data mining),工学-交通运输工程-城市交通-城市交通规划-信息数据挖掘,在大量的数据中发现隐藏于其中的信息、机理和规律,并最终转换为可理解的知识的过程统称,是提高数据利用率和价值、充分发挥数据作用的基本技术。交通数据挖掘常用的方法可分为聚类分析、回归分析、分类分析、关联规则、特征分析等。聚类分析是指在不预先定义类别的情况下,按照相似性和差异性将数据分类,使同类别数据间的相似性尽可能大,不同类别数据间的相似性尽可能小,代表性的算法如:基于密度的聚类算法(DBSCAN)、K均值聚类算法(K-means)等。回归分析主要用于发现变量和属性间的依赖关系并预测趋势特征,代表算法如:逻辑回归、岭回归、树模型等;分类是指通过数据对象的共同特点构建分类模型,将数据项映射到某个已定义类别的过程,代表算法如:K-近邻、支持向量机(SVM)、决策树等。