解析服务器FB-DIMM全缓冲内存技术
- 摘要:FB-DIMM的性能表现将会如何呢?通过Intel的模拟分析表明,FB-DIMM由于全缓冲的设计,在低带宽应用时,潜伏期会比DDR2系统长,但随着容量与带宽需求的增加,潜伏期反倒渐渐成为了FB-DIMM的优势,而且带宽越大,这就优势也就越明显,从而证明FB-DIMM非常适合用于高端系统的内存体系。
- 标签:FB-DIMM 全缓冲内存 服务器内存
要说清FB-DIMM,我们最好还是先了解一下传统的Reg-DIMM。我们平常所使用的内存模组是Unb-DIMM(Unbuffered-DIMM,无缓冲DIMM),Unb与Reg-DIMM的最大区别在于模组上有无寄存器。在高容量模组上,内存芯片数量很多,而且在需要大容量内存的工作场合,内存模组的安插数量也是很多的,这使命令与寻址信号的稳定性受到了严峻考验。
很多芯片组的资料中都说明只有使用Reg-DIMM才能达到标称的最高内存容量,从这点就能猜到寄存器的作用——稳定命令/地址信号,隔离外部干扰。
在工作时,命令地址信号会先送入寄存器进行“净化”并进入锁存状态,然后再发送至内存芯片,芯片中的数据则不经过寄存器而直接传向北桥。由于要经过中继传输,所以内存操作的时序也会因此而增加一个时钟周期,这是它所带来的一个弊端,但在高端应用中,内存系统的稳定可靠的重要性远在性能之上,所以Reg-DIMM一般只用于高端市场,并且需要芯片组的支持才行(主要是Reg所引起的时序变化)。
在高端设备中,ECC基本都是必须的,因此市场上的Reg-DIMM也都无一例外的是ECC型模组,虽然也有无ECC的Reg-DIMM设计标准。现在再回头看看我们常用的Unb-DIMM,就很明白了。它关键就少了寄存器,但为什么不称之为Unregistered-DIMM呢?其实,Buffered与 Registered是Reg-DIMM的两种工作模式,前者在Reg-DIMM上并不常用,它是以时钟异步方式工作的,输出信号的再驱动不与时钟同步, Registered模式下输入信号的再驱动则与时钟同步。
显然,Buffered模式下的性能要更低一些。不过,从原理上讲Registered模式也是一种缓冲操作,只是与时钟同步而已。在SDRAM的Reg -DIMM上,Buffered与Registered模式通过REGE信号控制,但到了DDR SDRAM-DIMM时代,可能由于性能的原因Buffered模式被取消了。
好,简要介绍完Reg-DIMM,我们再看看FB-DIMM。从下面这张FB-DIMM系统结构图上可以看出很多新的设计。
与传统的Reg-DIMM只是在Unb-DIMM上加装寄存器、PLL等元件而成的方法不一样,FB-DIMM与同级的普通Unb-DIMM有了很大的变化。首先,DIMM与内存控制器之间的数据与命令的传输不再是传统的并行线路(ECC时数据线路至少需要72条),FB-DIMM是采用了类似于PCI-Express的串行接口多路并联的设计,目前的设计是上行 10路并联(位宽10bit),下行14路并联(位宽14bit),数据传输以串行的方式。
另外,从图中还可以看出,每个DRAM芯片不再直接与内存控制器进行数据交换,事实上,除了时钟信号与系统管理总线的访问(主要与SPD打交道),其他的命令与数据的I/O都要经过位于DIMM上的内存缓冲器(Memory Buffer)的中转,这可能就是全缓冲(Fully Buffered)这一叫法的来历。
有人可能会问,为什么FB-DIMM要做如此大的改动呢?原因在于传统的并行连接的方法已经不适应高容量、高频率的应用需求,从下图中我们能发现目前这种连接方式的缺陷。
短线连接方法不利于在频率提高的过程中提高通道内芯片容积 目前的DIMM采用的是一种“短线连接”(Stub-bus)的拓扑结构,这种结构中,每个芯片与内存控制器的数据总线都有一个短小的线路相连,这样会造成电阻抗的不继续性,从而影响信号的稳定与完整,频率越高或芯片数据越多,影响也就越大。
因此日后随着时钟频率的提高这种结构对内存通道内的芯片数量的限制作用也越来越大,在1999年,每个内存通道可以容纳140个内存芯片,而到了今年则下降到了70个,预计到2007年会进一步下降到20个左右。虽然对于普通的PC机,这种限制所产生的影响基本感觉不到,但这与企业级平台对内存子系统的容量需求不断高速提升(相对于普通PC机)的发展方向是背道而驰的。
传统内存子系统与应用需求间的容量差距逐年增加 在FB-DIMM架构中,每个DIMM上的缓冲区是相互串联的,之间为点对点的连接方式,数据会在经过第一个缓冲区后传向下一个缓冲区,这样,第一个缓冲区与内存控制器之间的连接阻抗就能始终保持稳定,从而有助于容量与频率的提升。
点对点的连接解决了“短线连接”所带来的困扰 另外,因为采用了串行传输的设计,使得FB-DIMM的引脚数大为减少,下表就是FB-DIMM的预计引脚数与基本的分配:
信号类型
|
差分信号
|
引脚数
|
数据(往DIMM方向)
|
10
|
20
|
数据(往控制器方向)
|
14
|
28
|
所有的高频信号引脚数
|
48个
|
电源引脚数
|
6个
|
接地引脚数
|
12个
|
共享信号(如时钟)引脚数
|
3个(大约)
|
引脚总数
|
约69个
|
要知道,目前的DDR-2 Reg-DIMM的引脚数为240个,与之相比,FB-DIMM还不到后者的1/3。而且,串行信号的大量采用也使得对同步的要求大大简化(但仍需要数据块的同步),有助于提高布线设计的效率并降低电路板设计的难度。
FB-DIMM与DDR2 Reg-DIMM之间的主板布线比较,显然FB-DIMM的布线要简单得多 接下来,其他的好处也接踵而至。基于以上特点,FB-DIMM内存子系统相对于现有的DDR2内存子系统具备了很大的优势。由于串行连接,可以用更少的引脚建立更多的内存通道,也是由于串行连接,还可以使通道内的芯片容积得以大幅度的增加,从而扩大了内存子系统的容量。
FB-DIMM与传统DDR2系统之间的最大容量与带宽比较 那么,FB-DIMM的性能表现将会如何呢?通过Intel的模拟分析表明,FB-DIMM由于全缓冲的设计,在低带宽应用时,潜伏期会比DDR2系统长,但随着容量与带宽需求的增加,潜伏期反倒渐渐成为了FB-DIMM的优势,而且带宽越大,这就优势也就越明显,从而证明FB-DIMM非常适合用于高端系统的内存体系。
FB-DIMM与DDR2系统的潜伏期/带宽坐标图,从中可以看出,带宽需求越高,FB-DIMM的优势越明显 |