用Vb提取网页中的数据

来源:百度知道 编辑:UC知道 时间:2024/05/02 00:36:16
我用vb来提取网页中表格中的数据,使用的是 webbrowser控件.但是在webbrowser.document中有些数据不能下载下来.后来发现,在"源文件"中可以查看到的数据能下载下来,若在"源文件"查看不到的数据不能下载下来.请问如何下载网页中的数据,除了webbrowser控件可用,还有什么控件或方法可用,且功能更强大?
首先谢谢两位热心人的帮助!
我把自己的问题说清楚一些.我在此网站中提取数据:http://live.netsh.com/match_gb.php假如我只想提取表格里面的内容,但是我下面的代码:
For Each tb In tbs
For i = 0 To tb.rows.length - 1
Set tr = tb.rows.Item(i)
For j = 0 To tr.cells.length - 1
str = str + " " + tr.cells.Item(j).innerText
Next j
Print #1, str
Next i
Next
重复了好多数据,并且表格里的内容似乎在一行.
另外一种情况就是在http://info.bet007.com/league_match/league_vs/2006-2007/31.htm网站中,其中间表格里的数据根本就提取不出来.
希望有心人给予指教,如果这两个问题解决了,那么对于网站提取数据就没有技术难度了.

引用问题。。很简单。。

提示下
1、在 WebBrowser1_DocumentComplete(ByVal pDisp As Object, URL As Variant)
中写代码,用URL判断下载完毕的是否你要提取数据的页面
2、用 WebBrowser1.Document.Frames(0).Document.body.innerHTML 访问帧页面中的内容
3、用字符串处理函数读取数据
4、访问不是帧页面中的内容用WebBrowser1.Document.body.innerHTML

VB中处理网页文件好象只有这个控件,它是IE的内核,功能已经很强大了.

你遇到的问题我估计是因为网页中使用了框架,你可以这么处理

因为框架网页其实也是由两个或更多的单独网页构成的,所以你也可以把构成框架网页的其中一个页单独打开来浏览,这样做后,就可以用webbrowser.document来取得数据了.

一般都是采用HTTPXML的。用WEBBROWSER的话,有些动态数据比较容易获取