Java 判断字符串中是否包含中文的实例详解

网友投稿 721 2023-04-11


Java 判断字符串中是否包含中文的实例详解

java 判断字符串中是否包含中文的实例详解

Java判断一个字符串是否有中文是利用Unicode编码来判断,因为中文的编码区间为:0x4e00--0x9fbb, 不过通用区间来判断中文也不非常精确,因为有些中文的标点符号利用区间判断会得到错误的结果。而且利用区间判断中文效率也并不高,例如:str.substring(i, i + 1).matches("[\\一-\\?]+"),就需要遍历整个字符串,如果字符串太长效率非常低,而且判断标点还会错误。这里提高 一个高效准确的判断方法,使用Java中的Character类:

实例代码:

package test;

import static java.lang.Character.UnicodeBlock.*;

import com.google.common.base.Strings;

public class CheckContainChinese {

public static void main(String[] args) {

String containChinese = "test,我有中文";

String containNoChiese = "test, i don't contain chinese";

System.out.println("containChinese 是否包含中文 :" + checkStringContainChinese(containChinese));

System.out.println("containNoChiese 是否包含中文 :" + checkStringContainChinese(containNoChiese));

}

private static boolean checkStringContainChinese(String checkStr){

if(!Strings.isNullOrEmpty(checkStr)){

char[] checkChars = checkStr.toCharArray();

for(int i = 0; i < checkChars.length; i++){

char checkChar = checkChars[i];

if(checkCharContainChinese(checkChar)){

return true;

}

}

}

return false;

}

private static boolean checkCharContainChinese(char checkChar){

Character.UnicodeBlock ub = Character.UnicodeBlock.of(checkChar);

if(CJK_UNIFIED_IDEOGRAPHS == ub || CJK_COMPATIBILITY_IDEOGRAPHS == ub || CJK_COMPATIBILITY_FORMS == ub ||

CJK_RADICALS_SUPPLEMENT == ub || CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A == ub || CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B == ub){

return true;

}

return false;

}

}

运行结果:

以上就是java 检查字符串是否含有中文的实例,如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:API(api)网关:为企业提供更好的数据安全与服务管理
下一篇:关于python测试dubbo接口超时的信息
相关文章

 发表评论

暂时没有评论,来抢沙发吧~