文本聚类
(图书馆·情报与文献学)
文本聚类(text clustering),图书馆·情报与文献学名词,一种重要的文本挖掘技术。根据文本文档的内容相关性来组织文档集合,将整个集合聚集成若干个有意义的簇,要求同一簇内文档内容的相似度尽可能大,而不同簇间的相似度尽可能小,从而改善检索性能。文本聚类不需要训练过程,不需要预先对文档手工标注类别,因此具有一定的灵活性和较高的自动化处理能力,是对文本信息进行有效的组织、摘要和导航的重要手段。
加载更多
领域
提 交
图书
情报
出版
传媒
词条相关
词条 主页
》
词条 科普
》
词条 事件
》
词条 题库
》
词条 知识
》