词性标注算法(POS tagging algorithm),文学-语言文字-计算语言学及语料库语言学-计算语言学-词性标注算法,可以自动地进行词性标注的算法。词性标注算法可以归纳为3类:基于规则的标注算法(rule-based part-of-speech tagger;简称rule-based POS tagger),基于统计的标注算法(statistic-based part-of-speech tagger;简称statistic-based POS tagger),基于转换的标注算法(transformation-based part-of-speech tagger;简称transformation-based POS tagger)。基于规则的标注算法一般都包括一个手工制作的歧义消解规则的数据库,这些规则要说明歧义消解的条件。例如,当一个歧义单词的前面是限定词时,就可以判断它是名词,而不是动词。基于统计的标注算法在解决词性标注歧义问题时,一般都使用一个训练语料库,来计算在给定的上下文中,某一给定单词具有某一给定标记的概率。