博威---云架构决胜云计算

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
12
返回列表 发新帖
楼主: network

全面揭秘英特尔Nehalem-EP至强5500服务器平台

[复制链接]
 楼主| 发表于 2009-7-23 06:39:40 | 显示全部楼层
为您量身定制的系统
标准版、企业版服务器:英特尔5520 和 5500 芯片组
    基于英特尔5520 和 5500 芯片组的服务器工作站平台搭载英特尔至强5500 系列处理器,可为高性能和主流服务器平台带来突破性的性能和一流的技术。
    英特尔5520 芯片组可支持英特尔快速通道互联链路速度为 6.4GT/秒、5.86 GT/秒 和 4.8 GT/秒的英特尔至强5500 系列处理器。
    此外,该芯片组支持 36 个 PCI Express 2.0 I/O 通道、面向虚拟化操作系统的英特尔VT-c 和英特尔VT-d 增强特性、英特尔动态节点功耗管理(IntelDynamic Power Node Manager)系统管理及英特尔ICH10、ICH10R 和英特尔6700PXH 64-位 PCI 中枢。
    英特尔5500 芯片组可支持英特尔快速通道互联链路速度为6.4 GT/秒、5.86 GT/秒 和 4.8 GT/秒的英特尔至强5500 系列处理器。此外,该芯片组支持 24 个 PCI Express 2.0 I/O 通道、面向虚拟化操作系统的英特尔VT-c 和英特尔VT-d 增强特性、英特尔动态节点功耗管理系统管理及英特尔ICH10、ICH10R 和英特尔6700PXH 64-位 PCI 中枢。
高性能计算系统和工作站:
    在单/双 I/O 中枢(IOH)配置中采用英特尔5520 芯片组通过提高互连带宽、优化系统带宽、扩大内存容量、改进网络流量处理,同时降低 I/O 延迟,英特尔5520 芯片组可以显著改进基于英特尔至强5500 系列处理器的工作站和 HPC 系统中的数据传输。
    以下平台改进有助于匹配英特尔至强5500 系列处理器的性能提升:
• 通过英特尔快速通道互联技术实现点对点连接,速度达到4.8、5.86 或 6.4 GT/秒。
• 双 IOH 配置可实现更出色的 I/O 连接,最多可支持 72 个 PCIExpress 2.0 通道。
• 支持多个 x16 或 x8 PCI Express 2.0 显卡
• 英特尔VT-c 和英特尔VT-d 虚拟化技术增强。
• 支持英特尔动态节点功耗管理系统管理。
• 英特尔ICH10 和 ICH10R。
 楼主| 发表于 2009-7-23 06:40:06 | 显示全部楼层
对于企业用户来说,服务器系统的升级非常谨慎,只有在时间就是生命的HPC和渲染领域里才会单纯追求更高的性能,而这部分只占整个服务器市场的大约5%,其余95%更看重投资回报率(ROI),平均要3-5年才会换代更新一次。据Intel估计,目前使用中的服务器有40%还是单核心处理器,双核心同样在40%左右,四核心只占20%。
而Intel的另一份图表显示,2007年的时候四核心在其服务器处理器出货量中的比例已经达到大约25%,2008年更是接近80%(包括六核心),同时单核心已经近乎消失
那么Intel如何才能说服企业升级到四核心系统呢?答案就是今天发布的Nehalem微架构Xeon 5500系列。当然,该系列主要面向双路领域。
其实在Core i7发布前后我们就已经反复强调过,Nehalem架构的设计初衷其实是增强服务器和工作站应用性能,很多新技术也都是因此而来的,包括QPI直连总线、集成内存控制器、三通道DDR3等等:
1、Nehalem内存控制器直接访问本地内存或远程内存(NUMA),访问周期仅有24-54纳秒(80-161个循环),而上代Penryn Xeon 5400需要绕过芯片组里的内存控制器,在同频率下耗时长达123纳秒!另外AMD“上海”也集成了内存控制器,不过速度稍慢一些,需32-71纳秒。
2、Nehalem与“上海”一样是原生四核心设计,共享三级缓存的访问速度非常快,只需33个循环,这样二级缓存就能更轻松地与之交换缓存一致性信息,大大提高命中率。
3、Nehalem的内存控制器有三个通道,双路配置下使用DDR3-1333可获得35GB/s的带宽,而双路“上海”搭配DDR2-800为19.4GB/s。
4、Nehalem抛弃了共享式的前端总线FSB,改用点对点直连总线QPI,这样多路处理器之间通信的时候将完全不会存在交通拥堵问题。
可以这么说,从架构技术上而言,Nehalem相当于AMD“巴塞罗那/上海”平台的改进版,但做得更好。
此番发布的Nehalem Xeon 5500系列共有12款型号,规格差异很大:最高端的Xeon W5580主频最高3.2GHz,热设计功耗也达到了130W,仅限用于工作站市场;主推的是三款95W型号,其中X5570 2.93GHz是我们今天测试的主角;L和E系列功耗较低,分别只有60W和80W,不过其中部分型号缺失超线程和Turbo Boost加速技术。
关于动态加速,X系列的频率最多可自动提高266MHz,而L/E系列只有133MHz。有趣的是,X5570大部分时间都运行在3.07GHz,少数时间能达到3.20GHz,但却很少会在原始频率2.93GHz之下,这就是说你实际得到的频率要比标称得高一些。
今天的测试采用华硕RS700-E6/RS4作为基础平台,参测主角是新鲜出炉的Xeon X5570 2.93GHz/95W,作为对比的有45nm四核心Xeon E5450 3.00GHz/80W、65nm四核心Xeon X5365 3.00GHz/120W、65nm四核心Xeon L5320 1.86GHz/50W、65nm双核心Xeon 5080 3.73GHz/130W,另外还有AMD的Opteron 8356/8384,“上海”核心,主频2.3/2.7GHz。注意这两款处理器其实都是面向八路市场的,不过这里将其配置到双路系统里,再考虑到性能上其实没有本质区别,所以本文将它们标注为Opteron 2356/2384。
 楼主| 发表于 2009-7-23 06:41:14 | 显示全部楼层
再来看看功耗:
以及性能功耗比:
很显然,Xeon X5500在双路应用中的性能是无庸置疑的,精心设计的Nehalem表现表现相当出色,开启超线程技术更是能再度带来不小幅度的提升,在部分情况下甚至可以匹敌四路Opteron。虽然就绝对功耗而言仍然要略高于Opteron,但由于性能改进幅度更大,因此Xeon 5500的能耗比指标更胜一筹,达40%之多。
以下两个表格更能说明问题。我们按照将服务器市场划分为多个不同领域,分别对比上海Opteron 2384 2.7GHz和和新旧两代Xeon。在此前的Penryn Harpertown时代,Intel只有一个不起眼的“其他”领域获胜,而这部分的市场份额仅为2%,相比之下AMD在五个领域都居于领先地位(红色部分没有确切数据)。
现在,Nehalem Xeon来了,颜色就变成了一片蓝色,Intel几乎在每一个领域都当仁不让地遥遥领先。
最后是目前最新Xeon与Opteron的市场定位对比:
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|boway Inc. ( 冀ICP备10011147号 )

GMT+8, 2024-11-26 07:08 , Processed in 0.085913 second(s), 13 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表