谁知道哪里有“网站数据挖掘工具”?

来源:百度知道 编辑:UC知道 时间:2024/05/30 03:13:54
我想找一个“网站数据挖掘工具”,类似Web Scraper Plus软件,就是按照提前设计好的方案,把“规则”网站的相关数据采集下来——不是把整个网站(或者网页)抓下来!我遇到的问题时Web Scraper Plus没法处理中文字符——很郁闷!
我知道这个问题应该有点太偏了,我愿意把我现在所有的分数都给他(但是最大只能给100分),并且真的有用的话,我还会再加分给他!——如果提供的软件真的能用!
非常感谢大家的帮助!提前说声谢谢!——拜托各位了!

补充一下:这种软件的运作模式大概是,提前把相关网页的URL地址输入到数据库,并且设置好需要提取的数据的相关位置,然后执行Task,由程序(定期)自动的实时抓取相关“数据”,并且自动塞到(insert)到数据库。

soukey采摘 http://www.soukey.com/yijie/index.html
应该可以满足你的要求
提前预制网址规则,支持自定义网址参数,预订采集规则,支持正则,所有信息保存为一个任务,存储在本地格式为:xml文件。
需要采集时则运行这个任务,一个任务可以运行多个实例,采集完毕后可自动存储xml数据文件,也可以根据任务的配置信息存储access数据库文件。
只要定制了任务其他工作都是自动完成,支持多任务、多线程的运行模式。你可以去看看,如果不满足你的要求,可以把源码拿下来改改。我觉得应该是满足你的要求。

这个,是很偏呢