大数据数据结构(data structures of big data),理学-统计学-大数据统计分析-大数据数据特征-大数据数据结构,包括结构化数据、半结构化数据和非结构化数据。结构化数据是由二维表结构逻辑表达和实现的数据,又称行数据。它严格遵守数据格式与长度规范,通常包括关系数据库和表格数据。结构化的数据应用场景广泛,如企业资源计划(ERP)、医院信息系统(HIS)数据库、教育一卡通和其他核心数据库等。结构化的数据具有易输入、存储、查询和分析的优点,而且由于存储、内存和处理的高成本和性能限制,使用结构化数据的关系数据库和电子表格是唯一有效管理数据的途径。结构化数据主要标记方式是超文本标记语言(HTML)代码标记(包括微数据、微格式和RDFa三种标记方式)。半结构化数据是一种不符合一般关系数据库或表格数据的结构化数据形式,但是它仍包含标签和分离语义元素的标记,并且在数据内部存储时满足一定的层次结构,因此有时也被称为自描述结构。在半结构化的数据中,属于同一类的实体其数据属性可能有所不同,并且属性的顺序并不重要。