Flask接口签名sign原理与实例代码浅析
463
2022-11-24
Java正则表达式如何匹配特定html标签内的内容
如题:
使用正则表达式,怎么匹配特定html标签内的内容。
比如,对于如下文本串:
... ignored content
prefix content
inner content
postfix content
... ignored content
我们要提取出标签内的内容: inner content(这里的html标签可以换成任何其它的标签,比如
标签)
这里引入正则表达式的group概念:详细点击文章查看
比如:对于一个正则表达式( ( A ) ( B ( C ) ) )
group 1为:( ( A ) ( B ( C ) ) )
group 2为:( A )
group 3为:( B ( C ) )
group 4为:( C )
这样,我们就能够构造出如下的正则表达式:.*(<(html>)(.*)\2).*
此表达式的group概念为:
group 1: (<(html>)(.*)\2)
group 2: (html>)
group 3: (.*)
显然我们要求的就是group3的内容。
注意:\2是对group2的引用,也就是html>
该正则表达式也可以写成: .*(<(html>)(.*)(html>)).* 化简其实就是.*(.*).*
代码实现为:
String p = ".*(<(html>)(.*)\\2).*";
String m = "prefix午休abcpostfix";
System.out.println("Pattern: " + p);
System.out.println("StrinVNftZAotGEg to be test: " + m);
Pattern pattern = Pattern.compile(p);
Matcher matcher = pattern.matcher(m);
if(matcher.matches()) {
System.out.println("Matched String: " + matcher.group(3));
} else {
System.out.println("So sad, not matching anything!");
}
总结
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~