截词检索是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。尤其在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。 截词检索一般是指右截词,部分支持中间截词。截词检索能够帮助提高检索的查全率。
截词检索的方式有多种,可以分为有限截词、无限截词和中间截词。
1.有限截词:
有限后截词主要用于词的单、复数,动词的词尾变化等。将若干个截词符放在检索词(关键词、主题词)的词干或词尾可能变化的位置上。
2.中间截词:
一般来说,中间截词仅允许有限截词,主要用于英、美拼写不同的词和单复数拼写不同的词。
3.无限截词:
截去某个词的尾部,是词的前方一致比较,也称前方一致检索。在检索词干后加1个截词符 。表示该词尾允许变化的字符数不受任何限制。
转载请注明出处育才学习网 » 什么是截词检索它有哪几种检索方式