字节(Byte):字节是通过网络传输信息(或在硬盘或内存中存储信息)的单位。
一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间.
符号:英文标点占一个字节,中文标点占两个字节.
一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,如一个ASCII码就是一个字节,此类单位的换算为:
1千吉字节(TB,KiloGigaByte)=1024吉字节
(1TB=1024GB)
1吉字节(GB,GigaByte)
=1024兆字节
(1GB=1024MB)
1兆字节(MB,MegaByte)
=1024千字节
(1MB=1024KB)
1千字节(KB,KiloByte)
=1024字节
1字节(Byte)
=
8位(bit)
1.2
字符,字节,字符串
理解编码的关键,是要把字符的概念和字节的概念理解准确。这两个概念容易混淆,我们在此做一下区分:
概念描述
举例
字符
人们使用的记号,抽象意义上的一个符号。
'1',
'中',
'a',
'$',
'¥',
……
字节
计算机中存储数据的单元,一个8位的二进制数,是一个很具体的存储空间。
0x01,
0x45,
0xFA,
……
ANSI
字符串
在内存中,如果“字符”是以
ANSI
编码形式存在的,一个字符可能使用一个字节或多个字节来表示,那么我们称这种字符串为
ANSI
字符串或者多字节字符串。
"中文123"
(占7字节)
UNICODE
字符串
在内存中,如果“字符”是以在
UNICODE
中的序号存在的,那么我们称这种字符串为
UNICODE
字符串或者宽字节字符串。
L"中文123"
(占10字节)
由于不同
ANSI
编码所规定的标准是不相同的,因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种编码规则,才能够知道它包含了哪些“字符”。而对于
UNICODE
字符串来说,不管在什么环境下,它所代表的“字符”内容总是不变的。
温馨提示:答案为网友推荐,仅供参考