1. 实数的机器表示 (Machine Representation of Numbers)
在计算机中,实数无法以无限精度存储,而是采用基于科学计数法的浮点数系统 (Floating-Point System) 来近似。
一个浮点数系统通常表示为 ,包含以下四个要素:
- Base (): 基数(通常为 2 或 10)。
- Precision (): 精度,即尾数 (Mantissa) 的位数。
- Exponent Range (): 指数的范围,从 (Lower bound) 到 (Upper bound)。
任意浮点数 可以表示为:
- 舍入方式与精度的关系:
- Round-by-chop (截断):
- Round-to-nearest (舍入到最近): (这是 IEEE 的默认方式,更精确)。
5. 算术异常与数值稳定性 (Arithmetic Issues)
科学计数法在计算过程中会出现特有的问题:
- Overflow (上溢): 指数 。数值太大,超出表示范围,通常记为
Inf (Infinity)。
- Underflow (下溢): 指数 。数值太小,接近于 0,通常被处理为 0 或导致精度严重损失。
- Cancellation (相减消去/灾难性抵消): 当两个非常接近的数相减时(例如 ),有效数字会大幅减少,导致严重的信息丢失。这是数值计算中主要的误差来源之一。
- 不满足结合律 (Non-associativity): 浮点数加法通常不满足结合律,即 可能不等于 ,特别是当这三个数数量级相差很大时。