java正则匹配HTML中a标签里的中文字符示例-eolink官网

java正则匹配HTML中a标签里的中文字符示例

本文实例讲述了java正则匹配HTML中a标签里的中文字符。分享给大家供大家参考，具体如下：

今天群里一位朋友问到了一个正则表达式的问题，有如下内容：

453543

现在要匹配出内容包含中文但标签的属性中不包含comment的标签中的汉字。

解决思路如下：

1、首先匹配出不包括comment的标签；

2、在匹配结果中进行二次匹配出中文；

代码如下：

package com.mmq.regex;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

/**

* @use 匹配HTeLYoZHJML的标签中的中文字符

* @ProjectName stuff

* @Author mumaoqiang

* @FullName com.mmq.regex.MatchChineseCharacters.java

* @JDK 1.6.0

* @Version 1.0

public class MatchChineseCharacters {

/**

* 根据输入的内容，匹配出包含中文但不包含comment的标签中的中文字符

* @param source 要匹配的内容

* @return 标签中的中文字符

public static String matchChineseCharacters(String source) {

//匹配出包含中文但不包含comment的标签

String reg = "([^<>]*?[\\u4e00-\\u9fa5]+[^<>]*?)+(?=)";

Pattern pattern = Pattern.compile(reg);

Matcher matcher = pattern.matcher(source);

StringBuilder character = new StringBuilder();

while(matcher.find()){

String result = matcher.group();

System.out.println(result);

//对结果进行二次正则，匹配出中文字符

String reg1 = "[\\u4e00-\\u9fa5]+";

Pattern p1 = Pattern.compile(reg1);

Matcher m1 = p1.matcher(result);

while(m1.find()){

character.append(m1.group());

}

//System.out.println(character.toString());

}

return character.toString();

}

public static void main(String[] args) {

String result = matchChineseCharacters("特432453543a1特123你好123吗？特2 标签中的文字");

System.out.println(result);

}

输出结果如下：

a1特123你好123吗？

标签中的文字

特你好吗标签中的文字

这里做一下解释：

String reg = "([^<>]*?[\\u4e00-\\u9fa5]+[^<>]*?)+(?=)";

这个匹配内容包含中文但标签的属性中不包含comment的标签的正则中，不能使用向后查找?<=，因为向后查找只能是固定长度的内容，这里标签中属性不确定，所以不能使用；[\\u4e00-\\u9fa5]+匹配中文字符串；而(?=)使用向前查找?=，在结果中不会包含结束标签。

这个问题就这样得到解决了。如果说要匹配指定标签中的指定内容，那么也是很容易改进的了。若有更好的正则，还请留言相互学习。

PS：这里再为大家提供2款非常方便的正则表达式工具供大家参考使用：

javascript正则表达式在线测试工具：

http://tools.jb51.net/regex/javascript

正则表达式在线生成工具：

http://tools.jb51.net/regex/create_reg

希望本文所述对大家java程序设计有所帮助。

c#自定义Attribute获取接口实现示例代码

286 2023-06-19

java正则匹配HTML中a标签里的中文字符示例

Flask接口签名sign原理与实例代码浅析

zookeeper python接口实例详解

c#自定义Attribute获取接口实现示例代码

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路