自顶向下剖析(top-down parsing),文学-语言文字-计算语言学及语料库语言学-计算语言学-形式语言,从句子符号S开始,使用语法规则自顶向下地搜索出剖析目标的句法剖析。如果有包含三个词的汉语句子“林黛玉焚诗稿”,经过计算机自动切词之后,这个句子的词与词之间出现了空白,其形式变为: 林黛玉 焚 诗稿使用如下的短语结构语法G:G=(VN,VT,S,P)VN={S,NP,VP,V}VT={林黛玉,焚,诗稿}S={S}P:S→NP+VP (1)VP→V+NP (2)VP→V (3)NP→{林黛玉,诗稿}(4)V→{焚,叹息} (5)式中G为形式语法;VN为非中介符号的集合,这些符号是专门用来描述语法类别的,它们是范畴符号,如词类符号、词组类型符号等;VT是终极符号的集合,它们就是被定义语言中的具体的单词;S是初始符号,它是集合VN中的一个特殊成员;P是重写规则的集合;NP为名词词组;VP为动词词组;V为动词。 “林黛玉焚诗稿”自顶向下剖析的搜索树如下图所示。