并行检索(parallel retrieval),管理学-图书馆学-信息检索-【信息检索基本概念】-并行检索,指检索系统对给定的查询启动多个检索模块并行工作,再将各自检出的结果汇总返回的检索技术。并行检索是缩短检索系统响应时间的一种手段。当检索系统索引的信息量超过单个节点处理能力时通常采用多个索引节点。早期的检索系统主要用于规模有限的信息集合,用户访问也不密集,信息集合的索引建立在单机或集中式系统上,逐一处理用户查询。随着信息量剧增,单机或集中式系统结构受限于中央处理器(CPU)的处理能力、磁盘存储的容量等因素,不可能满足大数据量、快速响应的检索要求,并行处理成为一种自然的选择。海量信息被收集存储在不同节点,这些信息对应的索引数据也庞大到无法集中存放而位于多个节点。对给定的查询,如果逐一检索各个索引节点势必效率低下,也不利于支持用户的并发访问。一种常见的方案是:查询服务器接收用户给出的查询,进行词汇处理后得到若干查询索引词,将各查询索引词分配到多个索引节点,在节点内部匹配到相似文档后汇集起来,根据所有查询索引词的出现情况、依照相关排序策略得到最终的排序结果呈现给用户。