高难度正则表达式

来源:百度知道 编辑:UC知道 时间:2024/06/15 23:47:42
..............
<aaa id="A1">
.............
<bbb id="B1">
.............
</bbb>
.............
<aaa id="A2">
.............
<bbb id="B2">
............
</bbb>
.............
</aaa>
.............
<bbb id="B3">
.............
</bbb>
.............
</aaa>
.............

目的:我要获取 A1 中的 B1 and B3.
也就是我要获取特定A标签(比如A1)中的B标签(B1,B2,B3),
而B标签(B1 and B3)不能嵌套在特定A标签(A1)中的A标签(A2)中

怎么用正则把B1 and B3 给匹配出来?在线等
............. (省略号)是其他内容

A1 只是页面的某个特定的A标签, 缩进,换行只是更好的描述问题。。

要求只要满足:A1中的B标签,而不是A1中的A标签中的B标签(比如B1可以包含A标签)

大家都可以讨论啊!!!说说思路也行。

请确认:
标签A1是最外层吗?
我发现A1内部,每一行前有不同的缩进,此格式是否精确?
在B1,B2, B3中还会出现aaa或者bbb的嵌套标签吗?

感觉转成xml来做会不会简单点。