Java String字符串和Unicode字符相互转换代码详解-eolink官网

Java String字符串和Unicode字符相互转换代码详解

网上大部分有关“java String字符串和Unicode字符相互转换代码”的博文几乎都仅是将全为Unicode字符的字符串进行转换，而我们日常很可能需要的是将混有普通字符的Unicode一并转换（例如“\u0061\u0062\u0063(123)”，我们希望转换成“abc(123)”，而实际上网上的通用方法并不符合该需求，运行即报错），普通字符跳过而Unicode字符要进行转换，在进行字符串的查找替换截取什么的使用正则表达式往往是个很好的选择。

在进行代码讲解时我先贴出实现代码：

网上一般实现代码：

字符串转换unicode java方法代码片段：

/**

* 字符串转换unicode

* @param string

* @return

public static String string2Unicode(String string) {

StringBuffer unicode = new StringBuffer();

for (int i = 0; i < string.length(); i++) {

// 取出每一个字符

char c = string.charAt(i);

// 转换为unicode

unicode.append("\\u" + Integer.toHexString(c));

}

return unicode.toString();

}

unicode转换字符串java方法代码片段：

/**

* unicode 转字符串

* @param unicode 全为 Unicode 的字符串

* @return

public static String unicode2String(String unicode) {

StringBuffer string = new StringBuffer();

String[] hex = unicode.split("\\\\u");

for (int i = 1; i < hex.length; i++) {

// 转换出每一个代码点

int data = Integer.parseInt(hex[i], 16);

// 追加成string

string.append((char) data);

}

return string.toString();

结合正则实现的代码：

混有普通字符的Unicode转换为字符串：

/**

* 含有unicode 的字符串转一般字符串

* @param unicodeStr 混有 Unicode 的字符串

* @return

public static String unicodeStr2String(String unicodeStr) {

int length = unicodeStr.length();

int count = 0;

//正则匹配条件，可匹配“\\u”1到4位，一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}";

String regex = "\\\\u[a-f0-9A-F]{1,4}";

Pattern pattern = Pattern.compile(regex);

Matcher matcher = pattern.matcher(unicodeStr);

StringBuffer sb = new StringBuffer();

while(matcher.find()) {

String oldChar = matcher.group();//原本的Unicode字符

String newChar = unicode2String(oldChar);//转换为普通字符

// int index = unicodeStr.indexOf(oldChar);

// 在遇见重复出现的unicode代码的时候会造成从源字符串获取非unicode编码字符的时候截取索引越界等

int index = matcher.start();

sb.append(unicodeStr.substring(count, index));//添加前面不是unicode的字符

sb.append(newChar);//添加转换后的字符

count = index+oldChar.length();//统计下标移动的位置

}

sb.append(unicodeStr.substring(count, length));//添加末尾不是Unicode的字符

return sb.toString();

}

完整代码：

package util;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

/**

Title: String 与 Unicode 互相转换的工具类

Description:

Company: SCAU@Copyright

* @Copyright 1.0

* @author jodenhe (824923282@qq.com)

* @version 1.0

* @since 2017年8月17日下午9:42:50

public class StringUnicodeUtil {

/**

* 含有unicode 的字符串转一般字符串

* @param unicodeStr 混有 Unicode 的字符串

* @return

public static String unicodeStr2String(String unicodeStr) {

int length = unicodeStr.length();

int count = 0;

//正则匹配条件，可匹配“\\u”1到4位，一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}";

String regex = "\\\\u[a-f0-9A-F]{1,4}";

Pattern pattern = Pattern.compile(regex);

Matcher matcher = pattern.matcher(unicodeStr);

StringBuffer sb = new StringBuffer();

while(matcher.find()) {

String oldChar = matcher.group();//原本的Unicode字符

String newChar = unicode2String(oldChar);//转换为普通字符

// int index = unicodeStr.indexOf(oldChar);

// 在遇见重复出现的unicode代码的时候会造成从源字符串获取非unicode编码字符的时候截取索引越界等

int index = matcher.start();

sb.append(unicodeStr.substring(count, index));//添加前面不是unicode的字符

sb.append(newChar);//添加转换后的字符

count = index+oldChar.length();//统计下标移动的位置

}

sb.append(unicodeStr.substring(count, length));//添加末尾不是Unicode的字符

return sb.toString();

}

/**

* 字符串转换unicode

* @param string

* @return

public static String string2Unicode(String string) {

StringBuffer unicode = new StringBuffer();

for (int i = 0; i < string.length(); i++) {

// 取出每一个字符

char c = string.charAt(i);

// 转换为unicode

unicode.append("\\u" + Integer.toHexString(c));

}

return unicode.toString();

}

/**

* unicode 转字符串

* @param unicode 全为 Unicode 的字符串

* @return

public static String unicode2String(String unicode) {

StringBuffer string = new StringBuffer();

String[] hex = unicode.split("\\\\u");

for (int i = 1; i < hex.length; i++) {

// 转换出每一个代码点

int data = Integer.parseInt(hex[i], 16);

// 追加成string

string.append((char) data);

}

return string.toString();

}

public static void main(String[] args) {

String str = "abc";

String str2 = string2Unicode(str);

System.out.println(str2);

System.out.println(unicodeStr2String(str2));

System.out.println(unicodeStr2String("\\u61HJ\\u62\\u63(sfkfdsl)"));

}

代码运行结果图：

重要代码讲解：

代码的实现其实很简单，因此只对核心主要代码进行讲解，如对代码有疑惑可私信或留下评论！

1、正则匹配规则：

String regex = \\\\u[a-f0-9A-F]{1,4};

这个是正则匹配的规则，可能你会疑惑为什么使用“\\\\u”来匹配javan字符串的“\\u”，原因很简单，因为这样才匹配得上嘛（开个玩笑）直接看测试图1-2

测试图1：

测试图2：

很明显在菜鸟上使用两种匹配方式匹配到的结果是不同的，而java字符串需要转义，上图的“\u”java就应该是“\\u”，因此就要使用“\\\\u”来进行匹配！

[a-f0-9A-F]{1,4}

”[a-f0-9A-F]“ ：这个意思就是a到f，0到9,A到F出现的数都符合要求，“{1,4}”意思是前面的字符出现1到4个（其实一般的Unicode都是“\u”后面家4个字符的，如“\u0061”代表“a”，因此该式子可改为“\\\\u[a-f0-9A-F]{4}”，这样可能更符合实际要求）

其余的代码部分可查看源文件的注释，应该是可以理解的，慢慢推敲一下，应该不难。

以上所述是给大家介绍的Java String字符串和Unicode字符相互转换代码详解整合，希望对大家有所帮助，如果大家有任何疑问请给我留言，会及时回复大家的。在此也非常感谢大家对我们网站的支持！

Flask接口签名sign原理与实例代码浅析

1100 2023-01-07

Java String字符串和Unicode字符相互转换代码详解

Flask接口签名sign原理与实例代码浅析

java中的接口是类吗

vue项目接口域名动态的获取方法

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路

Java String字符串和Unicode字符相互转换代码详解

微信扫一扫：分享

推荐文章

最近发表

热评文章