美国当代英语语料库(Corpus of Contemporary American English; COCA),文学-语言文字-词典学-计算机辅助词典编纂,当代共时美国英语平衡语料库。简称COCA。由美国杨百翰大学的M.戴维斯(Mark Davies)主持创建,于2008年上线运行。截至2016年,美国当代英语语料库(Corpus of Contemporary American English,以下简称COCA)的总容量已达4.5亿余词,语料时间跨度为1990~2016年,包含了口语、文学、通俗刊物、报纸和学术期刊五种文体,各占大约20%库容,且每年至少做两次语料更新。口语取自150个不同的电视和广播媒体无稿谈话节目的录音文字,文学取自短篇小说和剧本等;通俗刊物约有100种,包括新闻、保健、家庭和园艺、妇女、金融、宗教、体育等方面内容,报纸包括《今日美国》《纽约时报》等美国10家有影响力的报纸的各种版面,如当地新闻、舆论、体育和金融等;学术期刊约有100种,覆盖了美国国会图书馆分类系统中的所有内容,按总量和字数的一定比例取样。