3

关于计算机存储单位的那些事

 1 year ago
source link: https://direct5dom.github.io/2022/05/15/%E5%85%B3%E4%BA%8E%E8%AE%A1%E7%AE%97%E6%9C%BA%E5%AD%98%E5%82%A8%E5%8D%95%E4%BD%8D%E7%9A%84%E9%82%A3%E4%BA%9B%E4%BA%8B/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
202205152053193.jpg

近期新购入的一块4TB西数紫盘,当仓库使用。

最近在搞和硬盘相关的东西,突然就被各种混用的存储单位搞昏了头,一时间竟然分不清谁是谁。

个人感觉这玩意要比光刻工艺被玩的更坏,不过其实分辨起来还是比较简单的。

单位基底:bit和Byte

bit和Byte的区别较为简单,任何拥有信息知识的人基本都能分辨二者。

bit(比特/位)

bit是英文binary digit的缩写。

bit是表示信息的最小单位,是二进制数的一位包含的信息,或2个选项中特别指定1个的需要信息量(即:0或1)。

一般来说,n bit的信息量可以表现出2的n次方种状态。

Byte(字节)

Byte是计算机信息技术用于计量存储容量的一种计量单位。

一个Byte可以存储8bit的数据,故存在2的8次方种状态,即可以表示256种状态。

正因如此,bit和Byte的换算为:1Byte=8bit。

单位前缀:十进制前缀(SI)和二进制前缀(IEC 60027-2)

相比较容易分辨的bit和Byte,两种前缀实际上经常被混淆、混用。

十进制前缀(SI)

十进制前缀即国际单位制词头,目前有20个词头,大多数都是千的整数次幂。

在存储单位中用到的词头共8个,具体如下:

中国大陆SI词头 英语SI词头 符号 十进制 启用时间
尧(尧它) yotta Y 1000000000000000000000000 1991
泽(泽它) zetta Z 1000000000000000000000 1991
艾(艾可萨) exa E 1000000000000000000 1975
拍(拍它) peta P 1000000000000000 1975
太(太拉) tera T 1000000000000 1960
吉(吉咖) giga G 1000000000 1960
mega M 1000000 1873
kilo k 1000 1795

二进制前缀(IEC 60027-2)

二进制前缀即二进制乘数词头(IEEE 1541-2002),采用的是2的幂次而非10的幂次。

在存储单位中用到的词头同样共8个,具体如下:

名称 符号 十进制
kibi Ki = 1,024
mebi Mi = 1,048,576
gibi Gi = 1,073,741,824
tebi Ti = 1,099,511,627,776
pebi Pi = 1,125,899,906,842,624
exbi Ei = 1,152,921,504,606,846,976
zebi Zi = 1,180,591,620,717,411,303,424
yobi Yi = 1,208,925,819,614,629,174,706,176

关于存储单位的混用

bit和Byte作为信息学科最基础的知识,基本上都能被大众所分辨。

宽带厂商往往喜欢使用bit而非Byte,因为这样可以让自己的带宽“看起来更大”。比如宽带厂商经常宣传自己的带宽是1000M,实际上说的是1000Mbps,换算到计算机常用的Byte则为125MB/s。此外还有一些硬件厂商,也会逮着较大的数据来展示。比如西数硬盘的DateSheet,就将Gb/s和MB/s混用。

202205152145026.png

与bit和Byte相比,前缀是混用更加严重的情况。个人认为根本原因可能在于国际电工委员会(IEC)自己的问题。

在2008年新标准出现之前,IEC的前缀和SI的前缀实际上是相同的(除了IEC的“千”可以使用大写“K”)。而在2008年新标准发布后,所有的前缀相比之间都多了一个“i”(例如:GiB),他们是1024(2的十次方)相乘得到。而没有“i”的存储单位则完全属于SI的标准(例如:GB),他们是1000(10的3次方)相乘得到。

虽然国际电工委员会(IEC)自己是这场混乱的罪魁祸首,但是包括Windows在内的很多厂商也是混乱的传播者之一。比如至今Windows的单位虽然采用IEC的标准,但仍然写着“GB”、“TB”等,而非“GiB”、“TiB”。

而因为前缀的混乱,导致很多硬件厂商会更加猖獗的在这上面做文章。比如大多数硬盘厂商都是按照SI的标准去制作硬盘,但却宣传的好像IEC标准一样。厂商所言1TB的硬盘确实是1TB(1000GB),同时也是931GiB,很容易就“缩水”了93GiB,即便他们确实“没做错什么”,而这种情况在越大的硬盘上表现出来的就会更加严重(即把IEC标准换算成Byte之后砍去所有零头)。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK