怎样将下面这句话从网页源文件中获取出来?

来源:百度知道 编辑:UC知道 时间:2024/06/24 06:08:31
是<titile>里面的,可是我不知道怎样获取出来
<meta name="keywords" content="你是我一生最爱的人">
呵呵 ,大哥我说的是用程序,现在我有源文件了,可是不知道怎样从中获取出这句话;呵呵,我是说用程序,比如正则表达式,把这句话中的值获取出来,或者,能把这句话先取出来也行,
帮之_li大哥,怎样把我说的这句话从网页源文件中提取出来呢?

先using System.Text.RegularExpressions

string source="<meta name=\"keywords\" content=\"你是我一生最爱的人\">";
string result=Regex.Replace(source, ".*content=\"([\\s\\S]*)\".*", "$1");

//result="你是我一生最爱的人";

不太懂你的意思,如果是想查看网页源代码,直接打开IE的 查看 源文件 就行了,是记事本打开的,可以直接复制。

‘引用命名空间
Imports System.Text.RegularExpressions
Imports System.Text.RegularExpressions‘用于分析网原代码用的
Imports System.Net.WebClient
Imports System.Net
Imports System
Imports System.Text
Imports System.Text.UTF8Encoding‘用于转化源代码为简体中文,要不会出现乱码

Dim Doc As New System.Net.WebClient
Dim TempText As String = System.Text.Encoding.Default.GetString(Doc.DownloadData("引用页地址"))
Dim result As String = Regex.Match(TempText, "\<meta[ ]{1}name.+content=.(.+).\>").Groups(1).Value '匹配提取网页中的内容
不成就