签名档(signature file),管理学-情报学-情报技术-情报组织技术,基于散列变换、面向单词的索引结构。又称签名文件。签名档技术适用于不太大的文本,它以在索引上顺序检索为代价,获得较低的开销(原始文本大小的10%~20%)。在大多数情况下,倒排档的效果要比签名档好。 签名档使用了散列函数(或签名)将词块映射成B位掩码中。它把文本分成含b个词的块,每个块分配长度为B的位掩码。如果一个词出现在某个文本块中,那么在这个词的签名中置1的位在文本块的掩码中也会置1。因此,如果当某位在查询词的掩码中置为1,而在文本块的掩码中并未置1时,这个词就不在文本块中。若B=6,b=4,切成块的样例文本的签名文件如图所示。