文本编码规范(text encoding initiative; TEI),文学-语言文字-计算语言学及语料库语言学-语料库语言学-﹝作品文件﹞,由国际性协会开发,得到学术界广泛认可,能够满足学术和商业广泛性目标的文本编码指南。简称TEI。随着计算机的普及和信息技术的发展,各类电子文本不断涌现,很多研究机构开始注重对这些数据资源的加工利用,研制开发了大量服务学术研究和应用开发的文本资源库。由于资源开发者对文本中的特殊字符、文本逻辑结构编目及内容信息的编码不一致,业界缺乏一个统一标准的编码方案,造成数据资源可交换性和可利用性的缺失,影响学术发展。