文本检索(Text Retrieval)与图象检索、声音检索、图片检索等都是信息检索的一部分,是指根据文本内容,如关键字、语意等对文本集合进行检索、分类、过滤等。技术介绍文本检索,亦称为自然语言检索,指不对文献进行任何标引,直接通过计算机以自然语言中的语词匹配查找的系统。文本检索进行匹配的对象,可以是整个出版的文本,包括文章、报告甚整本图书,也可以是它的部分,如文摘、摘录或只是文献的题名。以整个文献正文为对象进行的匹配查找,称为全文检索。这种方式无需标引,数据库制作快,可以很快投入运行典型文本检索最早最典型的文本检索是图书馆的图书索引,根据书名、作者、出版社、出版时间、书号等信息对馆藏图书进行索引,读者只需根据索引即可很快的查到所需要的书存放在图书馆的什么地方。计算机的出现随着计算机的出现,人们借助计算机可以更加方便的管理更多的文档,计算机硬盘甚至可以装下全世界所有图书馆藏书。为了快速查找计算机所管理的文档,出现了第一代文本检索技术,即根据关键字匹配,将包含关键字的文档挑出来作为检索结果呈现给用户。文档