200分求java网络爬虫的源代码

来源:百度知道 编辑:UC知道 时间:2024/05/24 23:48:57
要求 能从给的url开始爬 即使这个url不是rooturl
例如:给定url http://news.sina.com.cn/zt spider不会从http://news.sina.com开始爬

http://search.gougou.com/search?search=%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB&id=2

http://search.gougou.com/search?search=%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB&id=2

关键你搜什么出来,自己写一个也很简单,URL,HTTPURLConnection,HTMLparser加在一起即可

好像用C++做更简单一些.

我有现成的类,很完善了,我可以发给你,请留个邮箱地址!

我的邮箱是tq04q5k@163.com

发过去了