语言数据联盟(Linguistic Data Consortium; LDC),文学-语言文字-计算语言学及语料库语言学-语料库语言学-﹝机构团体﹞,由高校、图书馆、公司和政府研究机构共同组成,专事语言数据资源开发与利用的国际开放型非营利组织,试图解决语言技术研究和开发面临的核心数据短缺问题。简称LDC。20世纪90年代初,语言学领域经验主义思潮的复兴、算法技术的改善和个人计算机的普及,推动人类语言技术的发展,越来越多的研究机构和研究者都致力于提升计算机对语音和文本的处理能力,但由于数据稀缺、种类单一,难以据此构建强大、可移植和可扩展的语言处理系统,对关键语言数据资源的有效获取、归档、保存和分发成为学界和工业界关注的热点。宾夕法尼亚大学由于此前在宾州树库建设方面的经验,得到美国国防高级研究计划局提供的初始基金资助,从事推动语言数据资源的建设推广项目,此后得到美国国家科学基金信息和智能系统学部的持续资助。项目最初的目标仅设定为对已有语言资源的存储保管和分发。