GBK:
中国人的字符很多,大概有9万多个,用一个字节去存储完全不够用,所以中国人一般采用2个字节编码一个中文字符,这样大概可以存储6万多个信息(常用的信息也就6万多个),这套编码叫GBK编码,它必须兼容ASCII编码表。
ASCII:
因为美国人的字母信息较少,使用8个二进制(2的8次方为256)完全够用,一个字节存储一个字符完全够用,所以美国人使用ASCII编码。
UTF-8:
由美国人收集全球所有的字符,统一编号,这套编码叫UNICODE编码(万国码),utf-8就是一种变种形式,utf-8一个中文一般占3个字节,它也必须兼容ASCII编码表。
总结:
1、英文和数字在任何编码集中都是一样的,都占一个字节。
2、GBK编码中,一个中文字符一般占2个字节。
3、UTF-8编码中,一个中文字符一般占3个字节。
4、技术人员都应该使用utf-8编码。
