铁路大数据平台(railway big data platform),工学-交通运输工程-铁路运输-〔铁路信息化〕,面向铁路进行数据集中管理、数据集成、数据共享、大数据存储、大数据分析的数据服务平台。技术原理铁路大数据平台包括基础数据管理、数据集成、数据共享、大数据存储与分析等四个部分。基础数据管理部分实现铁路基础数据的统一、规范管理,包括铁路主数据、地理信息数据以及元数据信息。数据集成部分提供结构化数据和非结构化数据等不同数据类型的数据接入能力,对原始数据进行清洗、抽取、转换、标注及标准化处理。数据共享部分提供关系型数据库、分布式数据库、分布式文件系统等多种存储方式,汇总业务数据,为各业务应用系统提供数据共享服务,并对数据进行准实时分析,为数据仓库提供整合数据。大数据存储与分析部分按照主题域将数据抽取到数据仓库中并形成数据集市,提供数据分析、多维报表、管理员驾驶舱、数据挖掘等功能。铁路大数据平台总体架构如图1。