加权自动机(weighted automaton),文学-语言文字-计算语言学及语料库语言学-计算语言学,由有限自动机扩充而成的一种涵盖面广泛的自动机模型。在加权自动机的每一个弧上标有加权概率,表示下一步走哪一条途径的可能性。离开同一个结点的所有弧上的加权概率之和应该为1。一个加权自动机包括:状态序列q=(,,, …,);状态转移概率的集合,,, …,这个转换概率记录着从一个状态到下一个状态的概率。在加权自动机中,用结点(node)来表示状态。当两个结点之间的转移概率不为零时,用两个结点之间的边(edge)来表示转移概率。图1是关于英语单词“tomato”(西红柿)的两个加权自动机,均采用ARPAbet标音。图1上部的加权自动机表示在不同的方言中“tomato”一词的第二个元音的两种不同的发音,模拟在某些英国英语或美国英语东部方言中的社会语言变异;下部的加权自动机加上了协同发音效应,注意音位变异和社会语言变异之间的关联作用,说明了共计12个发音情况,包括“tomato”中的第一个元音可能的弱化和脱落,以及词末[t]可能的闪音化。