跨词结构(skipgram),文学-语言文字-计算语言学及语料库语言学-语料库语言学,非连续单词或词项的共选现象。是一种特殊的N元组(n-gram)或词语搭配。语料库语言学家J.M.辛克莱尔指出,语言使用者遵循习语原则,词项的共选(co-selection)让语言具有短语学倾向。如何确定词项关联的范围及它们在搭配中的呈现形式,并全部提取这些搭配,成为一个问题。自然语言处理领域的研究者提出N元组的概念。研究人员借用该概念描述连续相邻单词或词项构成的短语或搭配,如二元组(bi-gram)或三元组(tri-gram)是由两个或三个相邻单词或词项构成的短语。在该理论指导下提取的搭配,可以抓取在顺序上严格相邻的短语,如“a lot of people”(许多人),但却无法查找到“a lot of local people”(许多本地人)或“a lot of different people”(许多不同的人)这种非连续序列搭配。为弥补N元组的不足,研究者进而提出跨词结构的概念,用来描述非相邻词项的搭配现象。