求C#的正则表达式写法---从网页中提取内容

来源:百度知道 编辑:UC知道 时间:2024/05/22 06:27:22
想用C#从网页中提取内容,内容如下:

<div class="spaceborder" style="width: 770; margin-top:0px;">
<table border="0" cellspacing="0" cellpadding="4"
class="t_msg"
>
<tr>
<td style="height:40px; padding-left:40px;">ds6398854ads5fwwe</td></tr>
</table></div>
<div class="spaceborder" style="width: 770; margin-top:0px;">
<table border="0" cellspacing="0" cellpadding="4"
class="t_msg1"
>
<tr>
<td style="height:40px; padding-left:40px;"><div style="float:left;">sdfsdfwert12354</td></tr>
</table></div>
<div class="spaceborder" style="width: 770; margin-top:0px;">
<table border="0" cellspacing="0" cellpadding="4"

是不说用正则表达式不好,我在做分析网页的时候用正则表达式速度是相当慢的 , 我建议找到两个关键的位置
开始:top:0px;">
结束:</table>
得到位置 X Y
反复用substring(x+8,y)得到其值.
性能达到最优

"(<div class="spaceborder" style="width: 770; margin-top:0px;">)(.*)(</table></div>)"

Matchs[2]