CLAWS算法(CLAWS algorithm),文学-语言文字-计算语言学及语料库语言学-计算语言学-词性标注算法,成分似然性自动词性标注系统(constituent-likelihood automatic word-tagging system)的算法。1971年,布朗大学的美国学者B.格林讷(B.Greene)和G.鲁宾(G.Rubin)建立TAGGIT系统,采用86个词类标记,利用3300条上下文框架规则来排除兼类词歧义,自动标注正确率达到77%。1983年,英国学者I.玛沙尔(I.Marshall)、G.利奇(G.Leech)和R.加塞德(R.Garside)等人建立CLAWS系统,用概率统计的方法来进行自动词性标注。他们使用133×133的词类共现概率矩阵,通过统计模型来消除兼类词歧义,自动标注的正确率达到了96%。1988年,英国学者S.J.德洛斯(S.J.DeRose)对CLAWS系统做了一些改进,利用线性规划的方法来降低系统的复杂性,提出了VOLSUNGA算法,大大地提高了处理效率,使自动词性标注的正确率达到了实用的水平。