lucene中的skipInterval是什么意思?

来源:百度知道 编辑:UC知道 时间:2024/06/15 10:32:44
一直没明白。
lucene是开源全文搜索的一个东西

skipInterval是对频率与位置文件信息查询时,快速定位的跳跃跨度数值。

举一个建立skip层次信息的例子(某个单词在27个文档中频率信息,跳跃跨度为3,会出现3个层次)如下:

skipInterval = 3:
* c (skip level 2)
* c c c (skip level 1)
* x x x x x x x x x x (skip level 0)
* d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d

号 3 6 9 12 15 18 21 24 27 30

* d - document
* x - skip data
* c - skip data with child pointer

如同有27个房间,每3个房间出现一个控制间,在lognN n=skipInterval的情况下,出现3层(level0,level1,level2)查找时,level2保存在内存中减少占用内存的大小,定位某个元素只是需要查找lognN次便可定位到底层的skipinterval个元素集合中,内部最多遍历n次即可找到该元素。

我和家立写了一本书《Lucene分析与应用》,即将上市,呵呵,宣传一下!但你只要提出问题,我在网上就回答,技术交流,我不会和经济什么扯在一起!祝好!
老吴

http://www