多文档自动文摘(automatic multi-document summarization),文学-语言文字-计算语言学及语料库语言学-计算语言学-主题融合,对内容相近或相关的多个文档进行自动文摘。多文档自动文摘是自动文摘研究的一个热点,可以用于海量信息的自动汇总,尤其可以用于汇总互联网上针对某一特定事件的来自不同文档的多种信息。例如,当世界上发生重大的事件时,往往会有不同来源、不同方面的报道。读者如果想了解事件发生的详细情况,需要阅读大量的相关报道,这要花费很多的时间和精力。如果使用多文档文摘技术,把有关某个事件的大量信息汇总在较短的文摘之中,就可以大大地节省读者阅读大量报道的时间。多文档自动文摘结束还可以应用于历史事件的整理,连续事件的追踪。例如,对于事件的持续关注,事件的发生、发展到结束的各个阶段的相关信息,都可以使用多文档自动文摘摘取事件的主要内容,并且把这些内容按照事件发展的顺序组织起来,使读者通过阅读文摘,迅速了解整个事件的轮廓。基于主题查询的多文档文摘则可以进一步考虑用户的查询要求,从与特定事件的相关的大量文档中,自动生成用户需要的相关内容。