原创关于浮点数与定点数的理解与分析

 2012-10-31 20:51  1874 11 11 分类: MCU/ 嵌入式

定点数与浮点数

计算机处理的数值数据多数带有小数，小数点在计算机中通常有两种表示方法，一种是约定所有数值数据的小数点隐含在某一个固定位置上，称为定点表示法，简称定点数；另一种是小数点位置可以浮动，称为浮点表示法，简称浮点数。

1. 定点数表示法(fixed-point)

所谓定点格式，即约定机器中所有数据的小数点位置是固定不变的。在计算机中通常采用两种简单的约定：将小数点的位置固定在数据的最高位之前，或者是固定在最低位之后。一般常称前者为定点小数，后者为定点整数。

定点小数是纯小数，约定的小数点位置在符号位之后、有效数值部分最高位之前。若数据 x 的形式为 x = x₀.x₁x₂…x_n ( 其中x₀为符号位，x₁～x_n是数值的有效部分，也称为尾数， x₁为最高有效位 )，则在计算机中的表示形式为：

一般说来，如果最末位 x_n = 1，前面各位都为 0 ，则数的绝对值最小，即 |x|_min = 2^-n。如果各位均为 1，则数的绝对值最大，即 |x|_max =1-2^-n。所以定点小数的表示范围是：

2^{- n}≤ | x | ≤ 1 - 2^{- n}

定点整数是纯整数，约定的小数点位置在有效数值部分最低位之后。若数据 x 的形式为 x = x₀x₁x₂…x_n ( 其中x₀为符号位，x₁～x_n 是尾数， x_n 为最低有效位 )，则在计算机中的表示形式为：

定点整数的表示范围是：

1≤ | x | ≤ 2ⁿ - 1

当数据小于定点数能表示的最小值时，计算机将它们作0处理，称为下溢；大于定点数能表示的最大值时，计算机将无法表示，称为上溢，上溢和下溢统称为溢出。

计算机采用定点数表示时，对于既有整数又有小数的原始数据，需要设定一个比例因子，数据按其缩小成定点小数或扩大成定点整数再参加运算，运算结果，根据比例因子，还原成实际数值。若比例因子选择不当，往往会使运算结果产生溢出或降低数据的有效精度。

用定点数进行运算处理的计算机被称为定点机。

2. 浮点数表示法(floating-point number)

4与科学计数法相似，任意一个J进制数N，总可以写成

N = J ^E × M

式中M称为数 N 的尾数(mantissa)，是一个纯小数；E为数 N 的阶码(exponent)，是一个整数，J称为比例因子 J ^E的底数。这种表示方法相当于数的小数点位置随比例因子的不同而在一定范围内可以自由浮动，所以称为浮点表示法。

底数是事先约定好的(常取2)，在计算机中不出现。在机器中表示一个浮点数时，一是要给出尾数，用定点小数形式表示。尾数部分给出有效数字的位数，因而决定了浮点数的表示精度。二是要给出阶码，用整数形式表示，阶码指明小数点在数据中的位置，因而决定了浮点数的表示范围。浮点数也要有符号位。因此一个机器浮点数应当由阶码和尾数及其符号位组成：

其中 E_S表示阶码的符号，占一位，E₁～E_n 为阶码值，占 n 位，尾符是数 N 的符号（注意此处不是尾数的符号），也要占一位。当底数取 2 时，二进制数 N 的小数点每右移一位，阶码减小 1，相应尾数右移一位；反之，小数点每左移一位，阶码加 1，相应尾数左移一位。

若不对浮点数的表示作出明确规定，同一个浮点数的表示就不是唯一的。例如 11.01 也可以表示成 0.011012^-3，0.1101×2^-2等等。为了提高数据的表示精度，当尾数的值不为 0 时，其绝对值应大于等于 0.5，即尾数域的最高有效位应为 1，否则要以修改阶码同时左右移小数点的方法，使其变成这一要求的表示形式，这称为浮点数的规格化表示。

当一个浮点数的尾数为 0 时，不论其阶码为何值，或者当阶码的值遇到比它能表示的最小值还小时，不管其尾数为何值，计算机都把该浮点数看成 0 值，称为机器零。

浮点数所表示的范围比定点数大。假设机器中的数由 8 位二进制数表示(包括符号位)：在定点机中这 8 位全部用来表示有效数字(包括符号)；在浮点机中若阶符、阶码占 3 位，尾符、尾数占 5 位，在此情况下，若只考虑正数值，定点机小数表示的数的范围是 0.0000000 到 0.1111111，相当于十进制数的 0 到 127／128，而浮点机所能表示的数的范围则是 2 ^{- 11}×0.0001 到 2¹¹×0.1111（此处不用考虑符号位），相当于十进制数的 1／128 到 7.5 。显然，都用 8 位，浮点机能表示的数的范围比定点机大得多。

尽管浮点表示能扩大数据的表示范围，但浮点机在运算过程中，仍会出现溢出现象。下面以阶码占 3 位，尾数占 5 位(各包括 1 位符号位)为例，来讨论这个问题。图 2-1 给出了相应的规格化浮点数的数值表示范围。

图2-1 规格化浮点数分布示意图（图中的3是二进制的11，尾数包括符号位一共是5位，因为有一位是整个数N的符号位，所以，尾数的小数点后面只有4位；正数和负数的原理相同）

图 2-1 中，“可表示的负数区域”和“可表示的正数区域”及“0”（注意机器也可以表示0），是机器可表示的数据区域；上溢区是数据绝对值太大，机器无法表示的区域；下溢区是数据绝对值太小，机器无法表示的区域。若运算结果落在上溢区，就产生了溢出错误，使得结果不能被正确表示，要停止机器运行，进行溢出处理。若运算结果落在下溢区，也不能正确表示之，机器当 0 处理，称为机器零。（总之，上溢机器停止运行，下溢当机器零处理）