词性标注(Part-Of-Speech tagging, POS tagging)也被称为语法标注(grammatical tagging)或词类消疑(word-category disambiguation),是语料库语言学(corpus linguistics)中将语料库内单词的词性按其含义和上下文内容进行标记的文本数据处理技术 。历史词性标注是随着语料库的建立而提出的,在其发展初期是语料库中语法分析器(parser)的组件之一,词性标注的早期工作包括宾夕法尼亚大学(University of Pennsylvania)TDAP(Transformations and Discourse Analysis Project)项目中的语法结构模型 ,以及Sheldon Klein和Robert F. Simmons通过人工指定的上下文规则建立的自动化词性标注系统CGC(Computational Grammar Coder) 。1971年,Barbara B. Greene和Gerald M. Rubin以Klein and Simmons (1963)为基础开发了词性标注系统