ICS33.040.40
CCSM32
中华人民共和国国家标准
GB/T44596—2024
中文域名编码技术要求
TechnicalspecificationforcodingofChinesedomainnames
2024-09-29发布 2025-01-01实施
国家市场监督管理总局
国家标准化管理委员会发布目 次
前言 Ⅲ …………………………………………………………………………………………………………
1 范围 1 ………………………………………………………………………………………………………
2 规范性引用文件 1 …………………………………………………………………………………………
3 术语、定义和缩略语 1 ………………………………………………………………………………………
3.1 术语和定义 1 …………………………………………………………………………………………
3.2 缩略语 3 ………………………………………………………………………………………………
4 字符串预处理和中文域名字段预处理 3 …………………………………………………………………
4.1 字符串预处理框架 3 …………………………………………………………………………………
4.2 字符预备处理概要 4 …………………………………………………………………………………
4.3 映射 5 …………………………………………………………………………………………………
4.4 归一化 5 ………………………………………………………………………………………………
4.5 禁止输出 6 ……………………………………………………………………………………………
4.6 双向字符 6 ……………………………………………………………………………………………
4.7 字符串预处理框架中的未分配码位 6 ………………………………………………………………
4.8 中文域名字段预处理 7 ………………………………………………………………………………
5 Punycode编码 7 ……………………………………………………………………………………………
5.1 Punycode特点 7 ………………………………………………………………………………………
5.2 Bootstring架构 8 ……………………………………………………………………………………
5.3 Bootstring参数 9 ……………………………………………………………………………………
5.4 Punycode参数值 9 ……………………………………………………………………………………
5.5 Bootstring算法 10 ……………………………………………………………………………………
附录A(规范性) UNICODE保留字符表 13 ………………………………………………………………
附录B(规范性) 映射表 14 …………………………………………………………………………………
附录C(规范性) 禁止输出表 15 ……………………………………………………………………………
附录D(规范性) 双向字符表 17 ……………………………………………………………………………
附录E(资料性) Punycode编码解码例子 18 ……………………………………………………………
附录F(资料性) Punycode算法编码解码C语言实现例子 20 …………………………………………
ⅠGB/T44596—2024
前 言
本文件按照GB/T1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》给出的
规定起草。
本文件为中文域名技术系列标准之一,结构如下:
———中文域名总体技术要求;
———中文域名编码技术要求;
———中文域名解析技术要求;
———中文域名注册技术要求;
———中文域名字表技术要求。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中华人民共和国工业和信息化部提出。
本文件由全国通信标准化技术委员会(SAC/TC485)归口。
本文件起草单位:中国互联网络信息中心、暨南大学、中国科学院计算机网络信息中心、广东盈世计
算机科技有限公司、中国信息通信研究院、清华大学、中国电信股份有限公司、中国联合网络通信集团有
限公司、中国移动通信集团有限公司、中国通信标准化协会。
本文件主要起草人:姚健康、耿光刚、翁健、李洪涛、李彦彪、段海新、张曼、周琳琳、董科军、杨学、
延志伟、孔令飞、沙晓爽、傅瑜、刘越、龙春、赵静、郑晖、王超、孙乐、吴秀诚、张文伟。
ⅢGB/T44596—2024
中文域名编码技术要求
1 范围
本文件规定了在互联网体系上使用中文域名的编码规范,以及使用中文域名字段的预处理要求,同
时规定了利用国际区域名码进行中文域名编码的技术要求。
本文件适用于各级域名注册管理机构、域名注册服务提供商以及软件厂商开发支持中文域名的应
用或者服务等。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文
件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于
本文件。
IETF RFC3454 国际化字符串预处理(Preparationofinternationalizedstrings)
IETF RFC3491 国际化域名预处理(Nameprep:astringprepprofileforinternationalizeddo-
mainnames)
UNICODE UAX15 通用字符编码标准附录15(Theunicodeconsortiumunicodestandard
Annex#15)
UNICODE UTR21 通用字符编码技术规范21(TheunicodeconsortiumunicodetechnicalRe-
port#21)
3 术语、定义和缩略语
3.1 术语和定义
下列术语和定义适用于本文件。
3.1.1
通用字符编码 unicodeconsortiumunicodeencoding
根据其位置或码位来识别字符,给每个字符提供的一个唯一的数字。
注:比如,U+4E96指的是在UNICODE字符集中位于4E96处的字符。本文件的UNICODE字符编码采用了
ISO/IEC10646-1,UNICODE字符编码的集合称为UNICODE字符集。
3.1.2
分隔符 delimiter
在punycode里用来分隔的符号“-”。
3.1.3
域名字段 domainnamelabel
域名中由分隔符隔开的几个部分。
注:对于一个完整的域名“www.cnnic.cn.”,其中“www”“cnnic”“cn”分别是三个域名字段。
1GB/T44596—2024
3.1.4
中文域名字段 Chinesedomainnamelabel
含有中文字符的域名字段。
3.1.5
中文域名 Chinesedomainname
含有中文域名字段的域名。
3.1.6
码位 codepoints
字符的数字表现形式。
注:在UNICODE里,UNICODE码位用“U+”开始的4~6位16进制数表示。码位序列可用没有前缀的用空格分
隔的两位一组的十六进制数表示。
3.1.7
溢出 overflow
计算时超出了最大整数值。
3.1.8
国际化域名码 punycode
一种编码转换规则。
注:运用这种规则可实现UNICODE字符编码字符串和LDH字符串的相互转换。
3.1.9
LDH编码前缀 lettersdigitshyphenprefix
注1:LDH即Letter、Digit和Hyphen三个英文单词的首字母简写。由两个LDH字符后跟着两个连字符(其中字
母不区分大小写)进行表示的前缀。
注2:用于中文域名的LDH编码前缀是“xn--”。
3.1.10
存储字符串 storedstring
用在协议标识符和名称实体中的字符串。
3.1.11
查询字符串 querystring
用于和已保存的标识符相匹配或者相比较的字符串。
示例:域名查询中的域名部分。
3.1.12
先分解后合成的归一化形式 normalizationformwithcompatibilitycomposition
UNICODE归一化的一种形式。
注:先对字符进行兼容性分解,再对其进行规范合成。
3.1.13
基础字符 basiccodepoints
小范围字符集里的字符。
注:本文件一般指ASCII字符集中的字符。
3.1.14
非基础字符 non-basiccodepoints
大范围字符集里的字符。
注:本文件一般指UNICODE字符集里的字符(ASCII字符除外,ASCⅡ码等同于GB/T1988规定的字符编码)。
2GB/T44596—2024
GB-T 44596-2024 中文域名编码技术要求
文档预览
中文文档
39 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共39页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2025-07-18 03:44:01上传分享