asp采集小问题

来源:百度知道 编辑:UC知道 时间:2024/05/26 15:48:04
我要采集的页面大致代码如下:
<td>
<a href=1.htm class=1>标题</a>
<a href=2.htm class=1>标题</a>
<a href=15.htm class=1>标题</a>
<a href=12.htm class=1>标题</a>
<a href=14.htm class=1>标题</a>
</td>

我用

start=Instr(Html,"<a href=")+8
over=Instr(Html," class=1>")
url1=mid(Html,start,over-start)

<%=url1%>
只能采到第一条,我要采前3条怎么写代码呢?

Html=raplace(Html,"<td>","")'去掉多余的字符
Html=raplace(Html,"</td>","")'同上
link=split(HTML,"</a>")'把链接以</a>为接线打散到link数组
redim url(ubound(link))'定义一个url数组来存放链接的地址
for i=0 to link(link(ubound(link)))'遍历link数组将里面的href=的值提取出来
url(i)=raplace(link(i),","<a href=","")'替换a标签
url(i)=raplace(link(i),","class=1","")'替换样式标记
url(i)=raplace(link(i),",chr(34),"")'替换href=后面的双引号
resposne.write(url(i))
'可以在这里加一句退出 if i=2 then exit for
next
想取几条都行
if i=2 then exit for'取3条
10条就写成i=10
就好了