词性标记集(tagset of POS),文学-语言文字-计算语言学及语料库语言学-计算语言学-错拼检查更正,用于标注自然语言词性的标记的集合。进行词性标记,给句子中的所有词一个词性分类,是服务于语义分析的准备步骤。通行的英语标记集有3个:①宾州树库的标记集包含45个标记,是小标记集。②兰卡斯特大学UCREL计划的成分似然性自动词性标注系统CLAWS(参见CLAWS算法)使用的标记集C5,包含61个标记,是中型的标记集,C5标记集被用于标注英国国家语料库。③包含146个标记的大型标记集C7。在这里由于篇幅限制仅对于宾州树库进行展开说明。