句法语言模型(syntactic language model),工学-信息与通信工程-信号处理-离散随机信号处理-语音信号处理,对语音进行句法分析,模拟语言客观事实的抽象的数学模型。句法语言模型的重要部分是句法分析。句法分析的任务是识别出句子所包含的句法成分以及这些成分之间的关系,一般以句法树来表示句法分析的结果。句法分析方法可以分成两类:基于统计的方法和基于规则的方法。基于统计的方法有基于隐马尔可夫模型法、互信息法和基于中心词依存概率法等。基于规则的方法有增加句法标记法和删除句法标记法等。词法分析技术位于句法分析底层,已经基本成熟;语义分析技术建立在句法分析的基础之上。21世纪10年代,句法分析技术已经成为自然语言处理的一个瓶颈。句法语言模型中的句法分析主要有两大难点:①歧义。自然语音区别于人工语言的一个重要特点就是它存在大量的歧义现象。人类自身可以依靠大量的先验知识有效地消除各种歧义,而机器由于在知识表示和获取方面还存在严重不足,很难像人类那样进行句法分析消歧。②搜索空间大。句法分析是一个极为复杂的任务,候选树个数随句子长度呈指数级增长,搜索空间巨大。