参照语料库(reference corpus),文学-语言文字-计算语言学及语料库语言学-语料库语言学,在语料库对比研究中,作为参照对象、进行对比的语料库。与观察语料库相对。研究人员可以通过语料库软件生成词表(wordlist),对观察语料库和参照语料库词表的词频进行比较,使用卡方检验或对数似然值统计检验对比结果,得到观察语料库的主题词表(keywords list),为研究观察语料库的“所言之事”(aboutness)和文体风格(style)提供考察指标。作为研究的参照对象,参照语料库的内容、文体等特征会影响对比研究的结果。在观察语料库不变的情况下,选用不同的参照语料库会生成不同的主题词表。M.斯科特(Mike Scott,英国)和C.崔柏(Christopher Tribble,英国)将《罗密欧与朱丽叶》全文和四种不同的参照语料库(莎士比亚戏剧语料库、莎士比亚作品全集语料库、莎士比亚悲剧语料库和英国国家语料库)进行对比,发现最后得到的主题词表大不相同。