自动文本摘要(automatic text summarization),理学-统计学-大数据统计分析-机器学习,利用计算机自动从原始文本中提取文本摘要的技术。简史1958年国际商业机器公司(IBM)科学家H.P.卢恩(Hans P.Luhn)提出了采用词频统计的方法提取摘要的思想,开启了文档摘要提取技术探索的先河。1969年美国计算机学家H.P.埃德蒙逊考虑采用句子位置和线索词等因素确定句子权重,以权重作为提取重要特征句子的依据。1991年,加拿大计算机学家J.莫里斯(Jane Morris)和G.赫斯特(Graeme Hirst)提出利用词汇链模型提取文档主题和解析文档结构。美国计算机学家B.谢里菲(Beaux Sharifi)等人将词语加强(phrase reinforement,PR)与Hybrid TF-IDF用于摘要提取。