错误标注(error-tagging),文学-语言文字-计算语言学及语料库语言学-语料库语言学,对语料库中的语言使用错误信息进行标注的形式。20世纪90年代,一种新型的计算机学习者语料库(computer learner corpus,简称为CLC)出现,收集二语或外语学习者产出的自然语言数据。具有代表性的学习者语料库有比利时鲁汶大学创建的学习者英语国际语料库(International Corpus of Learner English,简称ICLE)、广州外语外贸大学和上海交通大学语料库团队共同建设的中国学习者英语语料库(Chinese Leaner English Corpus,简为CLEC)等。早期的学习者语料库研究主要关注学习者语言中的错误分析,因此对语料库进行错误标注至关重要。S.格兰杰(Sylviane Granger,比利时,1951~ )系统探讨、实践错误标注,发表了一系列论文。她指出,标注的错误信息包括两大类,一种是使用语言学范畴进行的错误描述性信息;另一种是导致错误产生的原因,受主观判断因素影响较大,不建议使用。因此,错误标注通常标注第一种信息。