语言信息处理是语言学与计算机科学交叉形成的一门以计算语言学理论为基础,具有广泛应用价值的语言工程学科,是应用语言学的重要组成部分。语言信息处理工程是一项多学科融汇的综合集成工程,其实质是有机地结合以语言学家和信息工程师为主体的专家干预、语料库构建(统计数据及信息资料)和语言信息计算机处理技术,为各种形式信息产品的制造提供有助于计算机软、硬件开发的程序保障和支撑环境。语言学界和计算机界通力合作,共同建立语言信息处理基础研究平台、应用关键技术平台和应用系统开发平台是语言信息处理工程实施的首要任务,而集体攻关的大协作方式则是语言信息产品开发的必要保证。语言信息处理 (LIP,Language Information Processing)有时也称作自然语言处理(NLP, Natural Language Processing)或自然语言理解(NLU, Natural Language Understanding), 自然语言处理是上位概念,包括理解和生成,而语言信息处理可以分别理解为语言信息|处 理”和“语言|信息处理”。