文摘生成(summary generation),文学-语言文字-计算语言学及语料库语言学-计算语言学-主题融合,在自动文摘中,自动生成文摘的内容。计算机在自动文摘中进行主题识别的时候,所提取的信息是不连续的。信息中省略了原文主题连接的关联词语,而且会有重复摘取及遗漏的情况,导致文摘的可读性较差,文摘信息不连贯。因此自动文摘系统有必要重新组合提取出来的摘要信息,通过文本规划、句子规划,把它们转化为自然语言输出给用户,生成流畅可读的自然语言句子,便于用户阅读和理解,这样的技术就是文摘生成。对于单纯的摘录系统,只要把摘取出来的结果列举出来就行了,不需要进行文摘生成。但是,在这样的情况下,不管摘录出来的主题是按文本原来的顺序排列还是按句子得分的高低进行排列,最后得到的文本一般都是不流畅的,因此需要进行文摘生成。针对摘要不流畅、不连贯、可读性差的问题,研究人员先后提出了一种平滑算法进行摘要不流畅的识别和修复,以及一个摘要的修订方案,对提取出来的摘要片断进行组合,生成简单的、可读性较好的摘要文本。也有研究人员从从文本生成的角度来提取摘要。