有关java正则匹配

来源:百度知道 编辑:UC知道 时间:2024/05/12 18:06:27
<a href='http://www.javaeye.com/topic/164204' title='java正则表达式' target='_blank'>

怎样用正则来表示 两边是< >的 中间有英文字母,数字,斜杠,中文的,空格的 字符串?

其实我是在做一个题目:
<h4><a href='http://www.javaeye.com/topic/14931' title='提问:java的正则表达式' target='_blank'>提问:java的正则表达式</a></h4>
如上网页源码所示,我需要提取出“提问:java的正则表达式”这段中文,
就是> 和<之间的文字。
我有一种思路就是用正则匹配,用“”替代掉<>之间的东西。剩下的就是我要的了。replace(,"").

Pattern pattern1 = Pattern.compile("<.+?>", Pattern.DOTALL);
Matcher matcher1 = pattern1.matcher("<h4><a href='http://www.javaeye.com/topic/14931' title='提问:java的正则表达式' target='_blank'>提问:java的正则表达式</a></h4>");
String string = matcher1.replaceAll("");
System.out.println(string);

这样可以的

这样····

public class Putin {
public static void main(String[] args) {
String string="<h4><a href='http://www.javaeye.com/topic/14931' title='提问:java的正则表达式' target='_blank'>提问:java的正则表达式</a></h4> ";
int x = string.indexOf("title='"); //获取下标
int y = string.indexOf("' target=");
St