标准文档是指按照一定标准编写的文档,可以有一致的外观、结构和质量。标准文档查询语言是指向标准文本查询的编程语言。标准格式不止只有一种,而是有很多种,不同标准文档格式不同有着不同的访问接口,导致了数据之间的兼容性很差。查询语言泛指向数据库或信息系统查询的各种编程语言。查询语言必须要能表达所有关系代数所能表达的查询,这样才被称为关系完整的。标准文档查询语言是指向标准文本查询的编程语言。网络上存在着大量非常有价值的文档,包括学术论文、数据资料、课件、简历等,它们大多以流式办公文档形式存在。这些文档质量较高、相关性强,并且垃圾信息较少,通过标准文档查询语言可以从查询或挖掘到很多有价值的信息。标准文档查询语言种类主要与文档的类型有关。