8

都工作两年了,还不知道浮点数如何转二进制? - 简书

 4 years ago
source link: https://www.jianshu.com/p/8de7db2f3c75?
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
0.9022020.05.01 09:52:39字数 1,659阅读 857
image

来吧,坐下聊

先前在前文 《老大说:谁要再用double定义商品金额,就自己收拾东西走》 中就已经痛彻心扉地聊过:

在处理诸如 订单交易货币计算、以及商品金额慎用浮点数(double/float)去定义变量,否则可能会遇到各种奇葩的问题,具体示例在那篇文章中都详细展示过。

当时写那篇文章的时候,我以为大家对于小数转二进制的换算早已了然于胸,所以也就没有给出具体的换算过程。结果文章发出来后,私信里一票小伙伴反馈说,文中那些小数转二进制的例子到底是怎么换算出来的,最好详解一下。

webp
image

得嘞,这不就来了嘛!

顺带聊一句,看来《计组原理》或者说《计算机系统》这门课有必要小规模回炉重造一下了(滑稽)。

不过实不相瞒,CRUD、复制粘贴、调接口、写业务代码久了,计算机基础确实好多都忘了...我也有深有同感!


浮点数在计算机中是如何表示的?

学过 《计算机组成原理》 或者类似 《计算机系统》 这些课程的小伙伴们应该都知道,浮点数在计算机中的存储方式遵循IEEE 754 浮点数计数标准,可以表示为:

image

采用尾数 + 阶码的编码方式,更通俗一点说,就是类似于数学课本上所学的科学计数法表示方式:有效数字 + 指数位

因此,只要给出:符号(S)阶码部分(E)尾数部分(M) 这三个维度的信息,一个浮点数的表示就完全确定下来了,所以floatdouble这两种类型的浮点数在计算机中的存储结构就表示成下图所示这个样子:

image
image

1、符号部分(S)

0-正 1-负

2、阶码部分(E)(指数部分)

  • 对于float型浮点数,指数部分8位,考虑可正可负,因此可以表示的指数范围为-127 ~ 128
  • 对于double型浮点数,指数部分11位,考虑可正可负,因此可以表示的指数范围为-1023 ~ 1024

3、尾数部分(M)

浮点数的精度是由尾数的位数来决定的:

  • 对于float型浮点数,尾数部分23位,换算成十进制就是 2^23=8388608,所以十进制精度只有6 ~ 7位;
  • 对于double型浮点数,尾数部分52位,换算成十进制就是 2^52 = 4503599627370496,所以十进制精度只有15 ~ 16

所以,浮点数交给计算机存储的时候,可能会有精度丢失问题!!!因此使用时需要格外小心,如果真因为这一块出了bug,定位问题还是非常艰难的,所以预防工作要做好。


进制转换计算案例

上面说的是IEEE标准规定的内容,属于理论规约。那一个小数到底要怎么换算成二进制呢?我们得拿实际例子来解释。

先来个简单的例子

比如:把十进制小数0.875转换成二进制,具体怎么操作?

可以分几大步走:

1、以小数点为界,拆分

2、整数部分转换

整数转二进制我想大家应该都熟悉,使用:除2取余法 即可。而这里的0.875整数部分为0,无需操作。

3、小数部分转换

小数部分的转换不同于整数部分,采用的是 “乘2取整法” ,图示一下就明白了:

image

4、合并结果

整数部分 + 小数部分,最终得到二进制结果为0.111

所以该结果按照上一节所述的尾数 + 阶码的计算机计数方式,则可以表示为:

image

所以对应可得:

  • 符号位0
  • 阶码(E)部分:若以float为例,应为 127 +(-1)= 126,因此二进制表示为:01111110
  • 尾数部分(M):若以float为例,应为23位,因此尾部补齐后为11000000000000000000000

因此最终的总结果为(以32位精度float表示):

00111111011000000000000000000000

再来个复杂点例子

再比如:把十进制小数6.36转换成二进制,具体怎么操作?

但凡能用图示,我就不想写文字,所以用一张图就可以解释得明明白白:

image

整数部分 + 小数部分,因此最终得到的结果二进制结果为110.01011100...

还是按照上一节所述的尾数 + 阶码的计算机计数方式,则可以表示为:

image

所以对应可得:

  • 符号位:0
  • 阶码(E)部分:若以float为例,应为 127 +(2)= 129,因此二进制表示为:10000001
  • 尾数部分(M)1001011100...,其实它本身无限不循环,但若以float型精度来截取23位,则可以表示为10010111000010100011111

因此最终的总结果为(以32位精度float表示):

01000000110010111000010100011111

所以像这种无限位数的尾数情况,用计算机存储产生截取是必然的,必定会有一定的精度损失!所以这也从根本上解释了为什么float或者double这种类型数据使用时的风险性,因此必须要结合实际业务理性考量。


大家如果对上面的计算结果不放心,或者想检查手动换算的结果是否正确,也有直接的这种二进制转换工具站,典型的比如binaryconvert

image

不想手动换算的,直接去上面输入,转换一下即可得到结果,而且可以进制互换,使用非常方便。


有时候回顾一下基础真的蛮有意思的,比如写这篇文章时,虽然是很基础的东西,但是表达出来的过程还是挺有趣的,尤其是画图展现的过程,希望能和小伙伴们共勉。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK