代码点与代码单元-eolink官网

代码点与代码单元

代码点可理解为字符。一个代码点就是一个字符

代码单元：不同编码，代码单元长度不一样。

UTF-8 中的代码单元由 8 位组成。UTF-16 中的代码单元由 16 位组成。UTF-32 中的代码单元由 32 位组成。GB18030 中的代码单元由 8 位组成。UTF-8在 UTF-8 中，因为代码单元较小的缘故，每个代码点常常被映射到多个代码单元。代码点将被映射到一个、两个、三个或四个代码单元。UTF-16UTF-16 的代码单元大小是 8 位代码单元的两倍。所以，标量值小于 U+10000 的代码点被编码到单个代码单元中。对于标量值大于或等于 U+10000 的代码点，每个代码点需要两个代码单元。在 UTF-16 中，这些代码单元对有一个独特的术语：“Unicode 代理对”。

注意
下面对 Unicode 代理对的支持进行了讨论。

UTF-32UTF-32 中使用的 32 位代码单元足够大，每个代码点都可编码为单个代码单元。GB18030在 GB18030 中，因为代码单元较小的缘故，每个代码点常常被映射到多个代码单元。代码点将被映射到一个、两个或四个代码单元。

java 采用utf-16编码，因此，通常一个代码点是一个代码单元，但有些辅助字符是2个代码单元。

在.NET里面，通常是用字节来衡量字符长度，但java是用代码单元。

c#自定义Attribute获取接口实现示例代码

294 2022-11-04

代码点与代码单元

Flask接口签名sign原理与实例代码浅析

zookeeper python接口实例详解

c#自定义Attribute获取接口实现示例代码

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路