一个汉字占用2个字符。
在 ASCII 编码中,一个英文字母的字符存储需来要1个字节。在 GB 2312 编码或 GBK 编码中,一个汉字字符自存储需要2个字节。在UTF-8编码中,一个英文字母字符存储需要1个字节,一个汉字字符储存需要3到4个字节。
在UTF-16编码中,一个英文字母字符或一个汉字字符存储都需要2个字节百(Unicode扩展区的一些汉字存储需要4个字节)。在UTF-32编码中,世界上任何字符的存储都需要4个字节。
汉字的文字编码标准主要有 ASCII、GB2312、GBK、Unicode等。ASCII 编码是最简单的西文编码方案。GB2312、GBK、GB18030 是汉字字符编码方案的国家标准。ISO/IEC 10646 和 Unicode 都是全球字符编码的国际标准。
为了解决中国、日本和韩国的象形文字符和ASCII的某种兼容性,出现了双字节字符集,DBCS从 第256 代码开始,就像ASCII一样,最初的128个代码是ASCII。
较高的128个代码中的某些总是跟随着第二个字节。这两个字节一起(称作首字节和跟随字节)定义一个字符,通常是一个复杂的象形文字。
参考资料来源:百度百科-ASCII