求一正则表达式写法

来源:百度知道 编辑:UC知道 时间:2024/05/12 20:32:52
我想取网页中某些具体的内容,请问该怎么写?
网页片段内容如下:
<div id="search" class="mainContent2">
<div class="textList">
<h2><span>IOC新闻</span></h2>
<div class="f12list newsList">
<ul>
<li>• <a href=http://www.beijing2008.cn/news/official/ioc/n214255129.shtml target="_blank" >两非洲选手竞争国际奥委会运动员委员会委员席位</a><span>[2008-02-23]</span></li><li>• <a href=http://www.beijing2008.cn/news/sports/headlines/others/n214255023.shtml target="_blank" >2008年英国奥运代表队将在澳门集训 250多人参加</a><span>[2008-02-22]</span></li><li>• <a h

其实正则很简单,主要是靠你自己的分析,既然你说到<ul></ul>这一块..那么这一块中肯定有很多字符,既然是很多字符,怎么搞,所以我们就要使用任意字符,任意字符有两种情况,一种是贪婪,一种是非贪婪,贪婪的意思是尽最大的匹配,比如说字符串为:
absadggdsa

贪婪模式匹配a结尾:所有的字符串
非贪婪:absa

使用贪婪和非贪婪,主要靠自己的分析,看了下楼上的表达式,觉得错误多多..

<ul></ul>没错,问题就是任意字符:

贪婪表达式为:<ul>.*</ul>

非贪婪表达式为:<ul>.*?</ul>

表示任意字符的有很多,不过我给出的以上表达式有一些个问题,为什么呢?因为.是不匹配换行的,比如说\n

一般的任意字符组合为:[\s\S],[\w\W]

说了这么多,不知道你明白不..

<ul>\w{n}</ul>

楼上是好人。我就借花献佛

<ul[\s\S]*</ul>