分布式搜索引擎(distributed search engine),管理学-情报学-信息检索-信息检索工具-搜索引擎-分布式搜索引擎,基于分布式信息检索技术的一种应用实体,可通过对多个独立检索系统的组织管理,实现对网络上大范围分布、异构的数据集进行统一检索的搜索工具。分布式搜索引擎由一个主搜索引擎和多个节点搜索引擎组成。主搜索引擎融合了各个节点的索引,并在此基础上提供统一的查询接口。节点搜索引擎则实现了对特定范围内信息的索引,并且可以提供独立的检索服务。节点搜索引擎的类型没有限定,既可以是特定领域的垂直式搜索引擎,也可以是网站的站内搜索引擎,甚至可以是深层网络中的数据库查询接口。根据主搜索引擎与节点搜索引擎之间的关系,分布式搜索引擎可分为分布协作式搜索引擎和分布非协作式搜索引擎两类。前者在主搜索引擎和节点间采用特定的通信协议,使之具有高效的信息交互,既继承了集中式搜索引擎的高效率,又体现出分布式搜索引擎的计算资源优势;后者的主搜索引擎和节点之间没有特定的通信协议,主搜索引擎只能采用抽样等方式探测和估计节点的信息,比前者效率略低。