如何从一个字符串中提取汉字

来源:百度知道 编辑:UC知道 时间:2024/06/20 22:23:19
asp.net 中 比如
字符串为

<h4>Type设为circle的列表,列表项前面的符号是空心圆:</h4>
<ul type="circle">
<li>站长网 站长学院之网页课程</li>
<li>站长网 站长学院之网页代码</li>
<li>站长网 站长学院之魔兽世界</li>
</ul>

如何提取出汉字
不好意思,问题变了一下
正则表达式要求是
只去掉 html字符,留下汉字和字母还有可能是数字
给你一段html,要求提取其中显示的东西

使用正则表达式查找替换所有的HTML代码为空就可以了。

/<(.*)>.*<\/\1>/这个就是匹配的所有html代码的正则。

补充:
using System.Text.RegularExpressions;//需要引用

// 利用正则表达式去掉"<"和">"之间的内容
private string StripHT(string strHtml)
{
Regex regex=new Regex("<.+?>",RegexOptions.IgnoreCase);
string strOutput=regex.Replace(strHtml,"");
return strOutput;
}

简单你看看 汉字在UNICODE编码里面的范围 就知道了

using System.Text.RegularExpressions;

string str="fdsa汉jklfda字ljklfdsa提jkflds取ljfjkds";
Regex rg = new Regex(@"[\u4e00-\u9fa5]");
str = rg.Match(str).ToString(); Response.Write(str);

---------------------
你自己加个循环嘛...

string str="fdsa汉jklfda字ljklfdsa提jkflds取ljfjkds";
string newstr="";
Regex rg = new Regex(@"[\u4e00-\u9fa5]");
for(int ii=0;ii<str.Lengt