GB13000是一项重要的编码标准,它构建了一个全新的编码体系,旨在更好地处理字符集的复杂性。ISO/IEC 10646以其"多八位"特性而知名,它使用四个8位(即字节)来分别标识字符的组、平面、行和字位,这种设计提供了极高的编码灵活性。
GB2312作为基础,规定了三千多个常用汉字,这些汉字涵盖了简体汉字。考虑到汉字数量庞大(约10万字),中国又相继增加了六个辅助集,其中基本集与第二、第四辅助集包含简化汉字,第一、第三、第五辅助集则涵盖了繁体字。这些辅助集之间有简繁体字的对应关系,但存在个别简繁字是一对多的情况。第七辅助集则源自GB13000.1中的CJK统一汉字,主要服务于日本、韩国和台湾地区。
GB13000的总编码容量是惊人的,达到了2,147,483,648个位置(128组×256平面×256行×256字位)。目前,我们主要关注的是00组的00平面,即"基本多文种平面"(BMP),它包含了65536个编码位置。在常规应用中,基本多文种平面的字符代码前两个字节固定为0,这使得它在处理时通常采用两字节的格式。
GB13000 全称:国家标准GB13000.1:1993《信息技术 通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面》,此标准等同采用国际标准ISO/IEC 10646.1:1993《信息技术 通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面》。Unicode 标准目前在基本平面上与GB 13000保持一致。采纳UTF-16方案作为未来实现01到0F共15个辅助平面的方式。其它方面与GB 13000基本一致。
本文如未解决您的问题请添加抖音号:51dongshi(抖音搜索懂视),直接咨询即可。