英语国家语料库(British National Corpus; BNC),文学-语言文字-词典学-计算机辅助词典编纂,一种大型、通用英语语料库。简称BNC。由英国牛津大学出版社主导,伯纳德和利奇等人主持,兰卡斯特大学、朗文出版公司、钱伯斯-哈洛普出版公司以及大英图书馆等于1991~1994年联合开发。1995年开始以CD光盘形式面向欧洲语言研究者发行,2001年稍作修订后在世界范围发行,2007年第3版开始改用XML格式,其载体也改为DVD光盘。英国国家语料库总库容为1亿余词,有4124个语言样本,分别处理9000余万词的书面文本和1000余万词的口语文本。其中,书面文本的分类涉及主题类别、文献媒介和时间三个参数,具体包括了70%的信息性文本和30%的文艺创作文本,取自书籍、报纸、杂志、书信、回忆录、学生习作等语言样本。口语文本取自长达2000个小时的录音,抽样人群考虑了不同年龄、地区和社会阶层等方面,涉及38个地区4个不同的社会群体,年龄在15岁~60岁,语料内容涵盖日常对话以及教学、商务、官方会议、电台节目等,具备良好的分不性和平衡性。