`

完整的CJK Unicode范围

阅读更多
12:05 AM | CJK, Unicode
2006.10

   因为FontRouter新版本开发的需要,在网上搜索了一下汉字的Unicode范围,普遍给出了“U+4E00..U+9FA5”。但事实上这个范 围是不完整的,甚至连基本的全角(中文)标点也未包含在内。为此,我特地查询了Unicode官方的Code Charts数据库,并根据最新的Unicode 5.0版整理如下:

注:在绝大多数应用场合中,我们可以仅用(1)、(2)、(3)、(4)、(5)的集合作为CJK判断的依据。

1)标准CJK文字
http://www.unicode.org/Public/UNIDATA/Unihan.html

Code point range Block name Release
U+3400..U+4DB5 CJK Unified Ideographs Extension A 3.0
U+4E00..U+9FA5 CJK Unified Ideographs 1.1
U+9FA6..U+9FBB CJK Unified Ideographs 4.1
U+F900..U+FA2D CJK Compatibility Ideographs 1.1
U+FA30..U+FA6A CJK Compatibility Ideographs 3.2
U+FA70..U+FAD9 CJK Compatibility Ideographs 4.1
U+20000..U+2A6D6 CJK Unified Ideographs Extension B 3.1
U+2F800..U+2FA1D CJK Compatibility Supplement 3.1

2)全角ASCII、全角中英文标点、半宽片假名、半宽平假名、半宽韩文字母:FF00-FFEF
http://www.unicode.org/charts/PDF/UFF00.pdf

3)CJK部首补充:2E80-2EFF
http://www.unicode.org/charts/PDF/U2E80.pdf

4)CJK标点符号:3000-303F
http://www.unicode.org/charts/PDF/U3000.pdf

5)CJK笔划:31C0-31EF
http://www.unicode.org/charts/PDF/U31C0.pdf

6)康熙部首:2F00-2FDF
http://www.unicode.org/charts/PDF/U2F00.pdf

7)汉字结构描述字符:2FF0-2FFF
http://www.unicode.org/charts/PDF/U2FF0.pdf

8)注音符号:3100-312F
http://www.unicode.org/charts/PDF/U3100.pdf

9)注音符号(闽南语、客家语扩展):31A0-31BF
http://www.unicode.org/charts/PDF/U31A0.pdf

10)日文平假名:3040-309F
http://www.unicode.org/charts/PDF/U3040.pdf

11)日文片假名:30A0-30FF
http://www.unicode.org/charts/PDF/U30A0.pdf

12)日文片假名拼音扩展:31F0-31FF
http://www.unicode.org/charts/PDF/U31F0.pdf

13)韩文拼音:AC00-D7AF
http://www.unicode.org/charts/PDF/UAC00.pdf

14)韩文字母:1100-11FF
http://www.unicode.org/charts/PDF/U1100.pdf

15)韩文兼容字母:3130-318F
http://www.unicode.org/charts/PDF/U3130.pdf

16)太玄经符号:1D300-1D35F
http://www.unicode.org/charts/PDF/U1D300.pdf

17)易经六十四卦象:4DC0-4DFF
http://www.unicode.org/charts/PDF/U4DC0.pdf

18)彝文音节:A000-A48F
http://www.unicode.org/charts/PDF/UA000.pdf

19)彝文部首:A490-A4CF
http://www.unicode.org/charts/PDF/UA490.pdf

20)盲文符号:2800-28FF
http://www.unicode.org/charts/PDF/U2800.pdf

21)CJK字母及月份:3200-32FF
http://www.unicode.org/charts/PDF/U3200.pdf

22)CJK特殊符号(日期合并):3300-33FF
http://www.unicode.org/charts/PDF/U3300.pdf

23)装饰符号(非CJK专用):2700-27BF
http://www.unicode.org/charts/PDF/U2700.pdf

24)杂项符号(非CJK专用):2600-26FF
http://www.unicode.org/charts/PDF/U2600.pdf

25)中文竖排标点:FE10-FE1F
http://www.unicode.org/charts/PDF/UFE10.pdf

26)CJK兼容符号(竖排变体、下划线、顿号):FE30-FE4F
http://www.unicode.org/charts/PDF/UFE30.pdf

以上翻译自Unicode官方网站,部分译法可能不够准确,还望大家予以指正!如有疏漏、错误之处也请一并指出,多谢!

分享到:
评论

相关推荐

    完整的CJK Unicode范围.txt

    因为FontRouter新版本开发的需要,在网上搜索了...但事实上这个范围是不完整的,甚至连基本的全角(中文)标点也未包含在内。为此,我特地查询了Unicode官方的Code Charts数据库,并根据最新的Unicode 5.0版整理如下:

    完整的CJK Unicode范围(5_0版)

    21)CJK特殊符号(日期合并):3300-33FF U3300.pdf 22)装饰符号(非CJK专用):2700-27BF U2700.pdf 23)杂项符号(非CJK专用):2600-26FF U2600.pdf 25)中文竖排标点:FE10-FE1F UFE10.pdf 26)CJK兼容符号...

    全部语言Unicode范围

    语言unicode范围整理,国家unicode范围

    各国文字Unicode编码范围

    Unicode 编码范围 各国文字 Unicode 编码范围 各国文字 Unicode 编码范围 各国文字 Unicode 编码范围 各国文字 Unicode 编码范围 各国文字 Unicode 编码范围 各国文字

    各国文字Unicode编码范围.zip

    世界各国文字Unicode编码范围,Unicode 编码范围 各国文字

    完整的unicode查找表

    我们一直在使用的unicode编码表,便于嵌入式产品使用。请保留备用!

    完整Unicode编码表

    很完整的Unicode字符编码表,基本上在官网上很难加载出来,因为很大。

    unicode-GBK编码对照表

    unicode-GBK编码对照表,支持24068个字转换,这个表格适合运用各个平台,小程序,c语言等。

    Unicode字符编码范围

    Unicode字符编码范围,希望对你有用!

    维吾尔文unicode编码表

    标准的unicode 编码表,提供的是现代维吾尔文的字母,标点符号等字符的编码

    Unicode完整版表

    Unicoder编码完整表

    维吾尔文字符集unicode编码表

    标准的现代维吾尔文字符集unicode编码表

    Unicode编码Unicode编码

    Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码

    Unicode 中文转换工具

    有的时候,遇见中文都被转化成了Unicode内码,看着很不爽,于是写了这么个小工具,用来将Unicode内码转换为中文,可以实现整篇的转换。 另外,此工具也可以将中英文转换为Unicode内码(您可以选择是否将英文转换)...

    完整UNICODE编码表

    Unicode编码则是采用双字节16位来进行编号,可编65536字符,基本上包含了世界上所有的语言字符,它也就成为了全世界一种通用的编码,而且用十六进制4位表示一个编码,非常简结直观

    完整汉字笔画笔顺Unicode和GB码数据库(20902汉字)

    完整的汉字笔画数笔顺数据库,包含ID、汉字、笔画数、笔顺、Unicode、GB码信息i。 每个汉字带有笔顺,可以通过笔顺知道汉字的构造和书写顺序; 可以通过给定一个笔顺,快速知道笔画数,比如笔顺为“34”,则笔画数...

    所有中文字Unicode编码区间及常用中文字Unicode编码

    所有中文字Unicode编码区间及常用中文字Unicode编码,在生成随机验证码时可能使用到

    让易语言支持Unicode

    不要在求官方支持Unicode啦自己完全能使得易语言支持Unicode 本源码Unicode播放音乐 Unicode文件名自己找,自己看源码,如果你问我界面不支持Unicode怎么解决那我想给你一拳,不会用UI?写代码最重要的是能傻瓜化就傻瓜...

    Fontcreate用Unicode编码下较完整的字符集分类压缩包

    Fontcreate用Unicode编码下较完整的字符集分类压缩包

    易语言Ansi与Unicode转换

    易语言Ansi与Unicode转换源码,Ansi与Unicode转换,AnsiToUnicode,UnicodeToAnsi,AnsiToUnicode2,UnicodeToAnsi2,RtlAnsiStringToUnicodeString,RtlUnicodeStringToAnsiString,RtlFreeUnicodeString,RtlFreeAnsiString...

Global site tag (gtag.js) - Google Analytics