书面汉语自动切词(automatic word segmentation of writing Chinese),文学-语言文字-计算语言学及语料库语言学-计算语言学-书面汉语自动切词,使用计算机对于书面汉语文本进行自动切分,使用空格来分割单词与单词之间的界限。书面汉语的书写形式不同于英语、德语、法语等印欧语言。英语、德语、法语等印欧语言在书写时,词与词之间用空格分开,因而词与词之间的界限在书面上是泾渭分明的;而汉语在书写时,词与词之间不留空白,一个汉语句子就是一大串前后相续的汉字的字符串,词与词之间的界限,被前后相续的汉字淹没得无影无踪了。有的学者曾经提出汉语书面文本实行词式书写的建议,但由于长期的书写和阅读习惯,人们对这种词式书写并不欢迎,目前实行词式书写的条件还不成熟。为了促进中文信息处理的发展,只得通过技术来解决这个问题,在中文信息处理中,实行书面汉语自动切词。在汉语的自然语言处理中,凡是涉及句法、语义的研究项目,都要以词为基本单位来进行。句法研究组词成句的规律,没有词就无所谓组词成句,因而也就无所谓句法。