一个c#的正则表达式提取内容

来源:百度知道 编辑:UC知道 时间:2024/05/24 23:42:33
以下是一段html代码:
<TABLE width="99%" border="0" cellspacing="0" cellpadding="0"> <TR> <TD align="center"><font color="#888888"></font></TD> </TR> <TR> <TD align="center"><b><font size="3">蒋菲:年方25坐拥4亿 曾是失业人员</font></b></TD> </TR> <TR> <TD align="center"><font color="#1063B5"></font></TD> </TR> <TR><td><HR> </td></TR> <TR><td align="center" bgcolor="#003483"><font color='#ffffff'>新华网浙江频道(2008-07-29 11:22:37) 来源新华网浙江频道综合 </font> <font color='#ffffff'>编辑:晓明</font></td></TR> <TR> <TD class="p1"><P>    新华网浙江频道7月29日电 散户暴富,总能引来广泛关注。
<P>    《每日经济新闻》7月25日报道的 《少

1、(?<=<font size="3">)(.*?)(?=</font>)
2、(?<=<font color='#ffffff'>)(.*?)(?=()
3、(?<=()(.*?)(?=))
4、(?<=来源)(.*?)(?=</font>)
5、(?<=编辑:)(.*?)(?=</font>)
6、(?<=<TD class="p1">)([\s\S]*?)(?=</TD>)
呵呵 是不是你想要的?我写的好辛苦哦o(∩_∩)o...

不知道你最后的格式是什么,应该很简单:
regex.replace(sourceStr, "<.*?>|\s", option);

option:
IgnoreCase, SingleLine, CultureInvariant

[\u4e00-\u9fa5][^<]*[\u4e00-\u9fa5]