在C语言程序中，为什么二维数组赋值的顺序会影响效率？

发表于 2019-08-27 20:08:55 | 已被访问: 531 次 | 分类于: C语言 | 暂无评论

学习C语言最有效的方法就是多做实验，很多初学者深知这一点。小明在学到二维数组时，尝试写了一段给二维数组赋值的代码，他发现一个奇怪的现象：交换赋值顺序，效率是不同的。请看下面这两段C语言代码：

int test1 ()
{
    int i,j;
    static int x[4000][4000];

    for (i = 0; i < 4000; i++) {
        for (j = 0; j < 4000; j++) {
            x[j][i] = i + j;
        }
    }

    return 0;
}

int test2 ()
{
    int i,j;
    static int x[4000][4000];

    for (j = 0; j < 4000; j++) {
        for (i = 0; i < 4000; i++) {
            x[j][i] = i + j;
        }
    }

    return 0;
}

这两个版本的C语言代码几乎完全相同，唯一的不同点在于交换了 i 和 j 变量，但是编译成C语言程序执行后，消耗的时间却是不同的，这是怎么回事呢？

可能有读者认为这两段C语言代码产生效率上的差异，是因为编译器处理这两段代码时，产生的指令不同。其实不是的，这两段“对称”的C语言代码产生的指令是一致的，请看：

仔细对比 test1() 和 test2() 对应的指令，我们很难发现二者有什么不同。事实上，二者运行的效率差异主要来自于“缓存命中率”。简单来说，就是连续操作C语言中的多维数组的最后一个维度最快，因此 test1() 中的赋值操作几乎每次都会错过缓存，而 test2() 中的赋值操作缓存命中率更高一些，因此 test2() 执行所消耗的时间更少。

在很多C语言初学者的脑海里，二维数组各个元素在内存中的分布可能是下面这样的：

但是计算机中的内存地址始终是一维的，因此在计算机眼中，二维数组仍然是按照一维排列的：

test2() 中的赋值操作先遍历第二维，这一过程是下图这样的：

此时C语言程序每次访问数组元素，在内存中都是顺序进行的，这对于缓存命中率的提升很有帮助。再来看 test1() 中的赋值操作，它优先遍历第一维，因此访问数组元素的过程是下图这样的：

显然，此时C语言程序访问数组元素在内存中是“跳跃式”的，但是，计算机访问内存各个地址的效率不是都一样的吗？那为什么 test1() 和 test2() 的效率不同呢？

答案就是 test1() 和 test2() 的缓存命中率不同。计算机 CPU 一般都有更加高速的缓存（称为“缓存线（cache line）”，常是 64 字节），访问这一缓存的速度比访问内存的速度要高的多（读者可以对比想象计算机访问内存的速度比访问硬盘数据的速度快得多）。

小明的C语言代码中赋值的元素是 int 型的（常常是 4 字节），因此 64 字节的缓存线可以容纳 16 个连续的整数，CPU 访问这 16 个数据要比访问内存里的 16 个数据快得多，并且 CPU 在加载缓存线数据的时间内，处理相当多的工作。

CPU 在处理 test2() 中的赋值时，可以获取 16 个连续的整数块，然后赋值给数组，重复 4000*4000/16 次，这样的操作在缓存线的支持下相当快，因为 CPU 没有被闲置，总是在处理事务。

再考虑 test1() 中的赋值，缓存线加载了 16 个整数块，但是接着值修改了其中一个整数，因此它需要重复 4000*4000 次，相比于 test2() 中的赋值，需要 16 倍的内存“回迁”次数。而 CPU 实际上需要花时间坐着干等内存操作完成，因此 test1() 的效率要低一些。

本节主要讨论了一个看似“灵异”的C语言二维数组赋值问题，这无关指令差异，更多的是缓存命中差异带来的效率差异。但是读者应该明白，并不是所有的计算机程序都如此，例如 Fortran 语言中，test1() 中的赋值效率要高于 test2() 中的赋值效率，因为它将二维数组在内存中展开时，是按照“列”优先排列的（C语言是按“行”优先排列的）。

阅读更多: C语言

在C语言程序中，为什么二维数组赋值的顺序会影响效率？

在C语言程序中，为什么二维数组赋值的顺序会影响效率？

Recommend

二维数组中的查找如何实现？看图！

C语言程序如果不关闭打开的文件，会发生什么？为什么要调用fclose() 函数？

C语言程序为什么那么快，它牺牲了什么换来的？C语言有什么缺点吗？

vue3使用reactive包裹数组如何正确赋值

如何求二维数组的前缀和？

POJ1195 Mobile phones（二维树状数组）

一个 async function 数组，怎样一个一个顺序执行？

js 嵌套数组赋值问题

Python中避免在给多维数组赋值之前判断key是否存在的方法

数组类型别名,类型不同却可以赋值是什么情况

About Joyk