原创 Cache基本原理学习笔记

2009-4-16 15:34 3460 7 6 分类: MCU/ 嵌入式

版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
http://redboot.blogbus.com/logs/31480025.html

随着计算机的飞速发展,虽然内存变得越来越大,但是在速度上面却跟不上cpu的发展。为了保证系统整体性能,cache的地位变得越来越重要。

Cache的原理很简单,就是根据程序访问的局部性,把最近访问过的数据或者程序缓存在一块速度更快的内存中。
现在的cache命中率一般都会超过90%,这样就解决了 越来越快的cpu和 越来越大却相对慢的内存之间的配合问题。

为了完成这个任务,简单的方法就是把cache分成许多行(line),每一行分为两部分,一部分是Data,保存缓存的数据,另一部分是Tag,保存这这些数据在内存中的地址信息。每行之间没有关系,这样每次cpu访问的时候,把地址给每一行的tag进行比较,如果有相同即为命中。这就是“全相联Cache ”。
这种方式的缺点是,每次内存访问都要跟每一行的tag进行比较,造成结构上的复杂。
假设cache大小为64KB,每一行的data是32B,那么就有2048 line, 一次内存访问要跟每一个line的tag进行比较,才能确定是否命中,显然太复杂了。

为了解决这个问题,就对其进行改进,改进的结果就是直接映像Cache。 这种方式把访问内存的地址分为3个部分。高位地址,低位地址,和行内部地址。比如,地址为32位,cache大小为64KB, 每行的data大小为32B。
那么地址位如下分配:
高位地址范围为:[31-16], 低位地址范围为[15-5], 行内部地址范围为[4-0]
比如:对于地址 0x12345678, 0x1234为高位地址, 0x567 >> 1 为低位地址, 0x18为行内地址
在访问该内存的时候,首先用低位地址作为行号来检索 0x567 >> 1 = 0x293 就是第659行cache,找到这行cache用0x1234与其tag内的地址比较,相等则命中。

很显然这种结构,非常简单,只需要跟一行进行比较就可以了。不过,它的缺点是每一行对应内存中很多不同的地址,而且这些地址只能缓存在这一行中。
比如,当上面那个地址缓存了之后,我们又要访问地址0x43215678, 这时候还是找到第659行cache,但是只能将0x12345678的数据作废,重新读入新地址的数据。如果,这种情况频繁发生,会大大降低系统效率。

为了解决这个问题就出现了改进的“组相联Cache“,组相联Cache 把cache分成几个独立的组。这样,虽然一个line可以对应内存中的很多地址,但是内存的这些地址可以存在不同的组中,这样碰到上述那种情形的概率就非常低了。

举个例子:64K cache分为4组,每组16K,每行32B,每组就有512行。
那么地址分配方式就变为:
高位地址范围为:[31-14], 低位地址范围为[13-5], 行内部地址范围为[4-0]
0x12345678 地址就对应到一组中的第147行,虽然地址0x43215678也对应在147行,但是他们可以分别存放在4组中的任意两组而互不影响。从效果上,和全相联Cache基本相当,却在结构上简单很多。所以,是当前常用的方式。

最近,需要用到cache看了一些介绍,做个简单的笔记。
这是一个基本的工作原理,实际上的cache要复杂的多,比如 write-through和write-back问题,cache aliases问题等等,而且不同的cpu cache的配置方式也各不相同,以后有机会再详细记录。
PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
我要评论
0
7
关闭 站长推荐上一条 /3 下一条