大数据索引的建立

来源:百度知道 编辑:UC知道 时间:2024/06/03 21:26:47
我现在又很多字符串(很大,内存存不下)。我想建立某些字符串的索引,比如,包含字符A的所有字符串,包括字符串B的所有字符串,如可以map <string, vector <string> > A.
但是,现在字符串很多,内存没法建立上面的map索引,也许第一个字段就是A可能内存就没有办法存。
我现在就是想建议这样的一个索引,有什么好的算法吗?

就是建立索引自己,我要找出包含A的所有字符串,就可以很快的找到并输出。

谢谢。

这我清楚,我觉得是周庄,分给我快有``

不知道你是想做工程还是作算法。做算法的话,那自己写些呗,把常用的索引放在内存,不常用的放在文件中.
如果是做工程,可以找相应的index generation开源工具。以前搜索引擎课上接触过,忘了叫什么了...

膜拜 ...

楼主真博学...

咱就没听过那东西 .... 汗 惭愧了