perl如何用substr方式定位提取<a>标签中的url?

来源:百度知道 编辑:UC知道 时间:2024/06/08 11:33:28
原来是用HTML::TokeParser来分析的,很方便,现在想学另一种用substr定位的方法来提取.

如html中所示
<a href="链接">字串</a>,

这样的超链很多,
用substr定位第一个<a href="的位置,再定位">的位置,复制中间的链接.接着再进行下一个定位,再复制中间的链接,直到所有的<a>中的链接被复制出来.
不知道该怎么做.
有2个条件字串是必须要的
1.<a href="
2.">

2.的可能还有' target='_blank'> 或是" target="_blank">

原处理文件如下:
<a href="/web-art/htmlbase/HTML/20060722/30195.html">如何以及何时使用sIFR</a></dt>
<dd class="preview">原文: http://usabletype.com/articles/2004/how-and-when-to-use-sifr/ 原作者: Andrew Hume 翻译: 阿宏 在分析sIFR之前,先来快速的了解一下sIFR是什么,以及它是如何工作的。sIFR表示scal...</dd>
<dd class="info">作者:<span>阿宏</span>发表于:<span>2006-07-22 07:23:00</span> 点击:<span>645</span> 评论:<span>3</span> <a href="/web-art/htmlbase/HTML/20060722/30195.html">查阅全文...</a></dd>
</dl><dl>
<dt><a href="/web-art/htmlbase/HTML/20060722/30194.html">HTML4标签的默认样式列表</a></dt>
<dd class="preview">原文来自:W3C ( 如何用手机定位 如何用perl切割这样的句子 如何用Perl匹配url根目录 跑跑如何用定位漂移 如何用word提取网页 如何用香蕉提取DNA 如何用GOOGLE EARTH定位自己家 如何用VBS提取QQ中的消息 如何用C++实现提取文件名? 如何用邮箱提取QQ号码