语言形式模型(formal models of language),文学-语言文字-计算语言学及语料库语言学-计算语言学,计算语言学中模拟语言客观事实的抽象的形式模型。由于现实的自然语言极为复杂,不可能直接作为计算机的处理对象,为了使现实的自然语言成为可以由计算机直接处理的对象,在计算语言学的研究中,需要把语言学问题用数学方法加以形式化,并表示为算法,建立自然语言的形式模型。语言形式模型不完全等同于语言客观事实,只是语言客观事实的某种近似物。在语言形式模型与语言客观事实之间,可以建立某种对应关系,但语言形式模型不能完全充分地描写语言客观事实,它只抽象描写语言中个别成分(词、句子等)的性质及关系(句法、形态等)。语言形式模型与语言客观事实之间的关系,如同数学上抽象直线与具体直线之间的关系。语言形式模型是一个单纯的、统一的、抽象的形式系统,语言客观事实经过语言模型的描述,比较适合于电子计算机进行自动处理,因而语言形式模型对于自然语言处理具有重大的意义。在计算语言学的研究中,算法取决于形式模型,形式模型是自然语言计算机处理的本质,而算法只不过是实现形式模型的手段而已。