指代消解是自然语言处理的重要内容,在信息抽取时,就用到了指代消解技术。广义上说,就是在篇章中确定代词指向哪个名词短语的问题。按照指向,可以分为回指和预指。回指就是代词的先行语在代词前面,预指就是代词的先行语在代词后面。按照指代的类型可以分为三类:人称代词、指示代词、有定描述、省略、部分-整体指代、普通名词短语。这些类别中前四个都是和语言学息息相关的,目前国内外的研究人员主要是偏向语言学领域的,对于不同的语言需要深入了解这种语言的机制,很难实现语言无关的方法和算法。对于我(这是?,下同)曾经尝试过的人称代词消解,感觉需要借助一些高级而且准确的语言分析工具,同时还需要多向中文系的师生请教。这个问题的研究让我感觉很难深入的完成创造性的工作。部分-整体指代在英文中成为Bridge-anaphora,主要消解一些整体-部分关系的指代,例如门和房间。这是一种上下位关系的指代。这个问题在英文中大有研究人员,但是对于中文却很少有从指代消解的角度来进行研究。因为,这个更像实体关系抽取。而实体关系抽取现在是信息抽取领域研究的一个热点问题。剩下的普通名词短语的消解。