隐含语义索引(latent smantic index),文学-语言文字-计算语言学及语料库语言学-计算语言学-自动标引,为了从海量文献中找出词与词之间的隐含关系而进行的索引。当两个词或一组词大量地出现在同一个文档中时,这些词之间就可以被认为是语义相关。机器并不知道某个词究竟代表什么,意思如何。例如,“电脑”和“计算机”这两个词在人们写文章时经常混用。这两个词在大量的文档中经常同时出现,搜索引擎就会认为这两个词是语义相关的,存在着隐含语义关系;又如,英文的“SEO”(search engine optimation的英文首字母缩写)和中文的“搜索引擎优化”这两个术语会大量地出现在相同的网页中,计算机可以从语义上把“SEO”“搜索引擎优化”以及英文的全名“search engine optimization”等术语关联在一起,认为它们之间存在着隐含语义关系。隐含语义索引试图绕开自然语言理解的瓶颈,通过大样本数量的统计分析,找出不同的单词、词组之间隐含的相关性,以使搜索结果进一步接近于用户真正要查找的内容,保证搜索的效率。