QQ登录

只需一步,快速开始

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 765|回复: 2

有关底层的国际化的处理实现问题

[复制链接]
发表于 2003-5-7 18:57:01 | 显示全部楼层 |阅读模式
我看了一些有关NLS的实现的说明,好像各个厂商都是使用utf-8来实现,我读了一些gb18030的说明,发现好像无法直接使用普通的转换把全部的gb18030码映射到UTF-8上,像SUN,TurboLinux都声称自己的实现是符合gb18030的,另外glibc也是使用的utf-8,有那位大侠能给讲讲是如何完成gb18030到utf-8的双向转换。
发表于 2003-5-7 20:24:53 | 显示全部楼层
就我的了解 gb18030编码不包含全部的汉字(当然了汉字有多少阿)而UTF-8也是不全的 一些文章上说gb18030是比utf-8大的集合(当然没有确认过)但是基本上unicode中utf-8编码使用的是最多的 所以实际使用中用utf-8解码也就可以了
GB18030 编码是一二四字节变长编码。 一字节部分从 0x0~0x7F 与 ASCII 编码兼容。 二字节部分, 首字节从 0x81~0xFE, 尾字节从 0x40~0x7E 以及 0x80~0xFE, 与 GBK标准基本兼容。 四字节部分, 第一字节从 0x81~0xFE, 第二字节从 0x30~0x39, 第三和第四字节的范围和前两个字节分别相同。 四字节部分覆盖了从 0x0080 开始, 除去二字节部分已经覆盖的所有 Unicode 3.1 码位。也就是说, GB18030 编码在码位空间上做到了与 Unicode 标准一一对应,这一点与 UTF-8 编码类似 utf-8的编码可以看http://www.ctosoft.com/book/utf8.html
最重要的区别就是他支持多种local
回复

使用道具 举报

发表于 2003-5-9 08:43:56 | 显示全部楼层
wsm,强啊,知道这么多
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

GMT+8, 2024-11-15 23:30 , Processed in 0.045282 second(s), 16 queries .

© 2021 Powered by Discuz! X3.5.

快速回复 返回顶部 返回列表