博威---云架构决胜云计算

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 2624|回复: 6

至强7500能抢走多少POWER7的奶酪?

[复制链接]
发表于 2011-2-5 16:40:59 | 显示全部楼层 |阅读模式
x86的实力增强 野心初现!

2010年真可谓是企业级处理器罕见的“福年”,在这一年中,我们迎来了多个重量级的崭新选手,覆盖了主流的x86和高端的小型机市场,其中有全球第一款12核心的处理器——AMD的皓龙6100、英特尔首个将QPI直连架构用于多路市场的8核心至强7500,还有就是IBM每三年一发布的新一代8核心POWER7
在这两个级别的选手中,以往基本上是井水不犯河水,人们很难会想到用x86平台去替代小型机平台,反之亦然。因为两者在性能、软硬性设计、企业级应用特性方面基本是有明确分工的。
提起小型机(Small Computer),它给人的感觉往往是很高端的。从计算的发展历史来看,小型机也的确资格更老,而且所采用的操作系统以及处理器也更为高端,因此小型机还有另一个名字——UNIX服务器。在如今Windows与Linux越来越盛行的年代,估计见过UNIX系统界面的人也越来越少了。所以,长久以来,UNIX服务器也好,小型机也罢,对于很多企业用户来讲,都代表着一种神秘与一种高不可攀。事实上,这种印象至今仍然没有太大的改观,而且小型机的发展则呈现出某种疲态。
小型机由于历史的原因,其使用的处理器基本上是厂商自有的,操作系统也基本上是处理器厂商自己开发的,这与现在的采用x86处理器开放架构的服务器(硬件基本上是通用而统一的,操作系统也是通用的)完全不一样,小型机厂商通过专有的硬件与架构来维护与垄断自己的市场,但是这个市场的大小也直接关系到了专有硬件的市场规模,进而影响到最终的成本。由于厂商可以按照自己的心意去定制服务器的硬件与操作系统,并进行针对性的优化,所以传统的观点认为,小型机的性能往往要比通用性更高的x86服务器强很多。这样一来,有实力的厂商都有着辉煌的小型机生产历史,延续至今,著名的小型机厂商仍然有三家,即IBM、HP(惠普)与Sun(目前已经被Oracle收购)。在这其中,IBM的小型机显然是最著名也是最有活力的,根据Gartner的数据,2009年第三季度IBM占据了42%的UNIX服务器收入市场份额,IDC的数据则是IBM占据了39.5%的份额,HP为29.2%。

英特尔在2009年3月发布至强5500处理器时给出的与小型机的性能、成本对比数据,其中Sun的T5240采用的是两颗1.4GHz的UltraSPARC T2 Plus处理器(8核心/64线程,双插槽共16核心/128线程)+32GB内存,IBM的P570采用的是两颗4.7GHz的Power6处理器(2核心/4线程,双插槽共4核心/8线程)+32GB内存,至强5500系统则是双至强X5570(2.93GHz)+32GB内存

然而,时过境迁。小型机如今的生存状况早已不能与十几年前同日而语,这其中所遇到的最大挑战就来自x86服务器。这是因为小型机性能再提高,去冲击大型机市场意义并不大,可下面的x86服务器的性能提升则对小型机形成了巨大的压力。随着英特尔、AMD两家厂商的技术与实力的不断提升,x86处理器在性能上可谓突飞猛进。很多原本只在小型机上才有的技术已经越来越多的出现在了x86处理器上,比如64位技术、虚拟化技术、多线程技术、多核心技术甚至高RAS(Reliability, Availability and Serviceability,可靠性、可用性与可维护性)特性等等。

而且,我们也能发现,处理器的架构不同,并不是最重要的(想想看三大游戏主机都是采用Power架构的处理器而非主流的x86处理器,你能说它代表了高端应用吗?),它无所谓高端与低端,关键还在于应用性能、成本并辅助以相应的RAS需求,并最终影响到市场规模,进而左右应用开发的规模,这反过来也决定了你的生态环境是健康的循环生长,还是恶性的循环消亡。

在这个过程中,我们看到了UNIX的变种——廉价Linux的兴起,这在很大程度上提高了x86服务器的健壮性,而随之而来就是Linux上的企业级应用迅速增多,传统的著名的企业应用软件都有了Linux版本,再配合x86系统硬件上的提升,对于小型机市场的冲击也就可想而知了。

2009年,应该是小型机所受到最大冲击的一年,根据Gartner公司的数据,UNIX服务器的收入所占的市场份额,从2009年第一季度的32%下降到了第三季度的27%,来自IDC的数据则显示,相对于2008年第三季度,2009年第三季度UNIX服务器的销售收入下降了23.4%,只有28亿美元。而在这一年里,英特尔推出了具有革命性意义的全新一代处理器至强5500,这款基于最新的Nehalem架构的处理器,在性能提升幅度方面是惊人的。而在至强5500的发布会上,英特尔拿出了与Sun和IBM的双插槽小型机的性能对比数据,让人看到了小型机至少在性能上已经不再像当初IBM的深蓝挑战国际象棋冠军那个时候,根本不把x86放在眼里。其实,很多人都可以感觉得到,小型机在性能上的优势越来越多的是以高扩展性来体现,而在打动用户方面,也更多的是以RAS特性为主,就单CPU而言,小型机处理器对阵顶级的x86处理器,已经没有完胜的把握,而且像Nehalem这种优秀的架构也在向多插槽系统迈进,这就是于今年3月31日正式推出至强7500

英特尔对于至强7500的定位,已经不再是传统的多路x86服务器市场,而是高调的提出了新的市场目标——RISC Replacement,即RISC替换市场,这在以往是从来没有过的,虽然有时会拿RISC系统做性能上的对比,但明目张胆的向UNIX系统挑战这无疑是第一次。

我们觉得英特尔的这一提法本身就很有意思,也很巧妙,因为传统的UNIX小型机的三大系统中,有两大系统的处理器是基于RISC(Reduced Instruction Set Computer,精简指令集计算机)架构——IBM的POWER与Sun的SPARC,而HP公司的小型机则是基于英特尔的安腾(Itanium)处理器,它采用的是EPIC(Explicitly Parallel Instruction Code,显性并行指令代码)架构,它即不同于x86处理器的CISC(Complex Instruction Set Computer,复杂指令集计算机)架构,也不同于RISC架构,所以英特尔强调RISC替换市场很明确就是指向了POWER与SPARC系统,而将自己的安腾家族置身世外,不过这也完全能够理解,毕竟安腾与至强都是同门兄弟嘛,不能自残。

当然,UNIX市场也没有停滞不前,虽然Sun目前仍然处在被Oracle收购过的过渡期,显得飘忽不定,但UNIX的老大IBM并没有闲着,今年2月8日推出的POWER7处理器,再次实践了POWER处理器三年一更新的规律(2001年发布POWER4、2004年发布POWER5、2007年发布POWER6),这种明确的规律性也显现出POWER家族发展的坚定步伐。

既然x86处理器已经翅膀渐硬,开始不满足自己的领地而向高端进军,而UNIX的领军人物POWER也不甘示弱,也就注定了2010年企业级市场的火药味要比以往更为浓重,这里不光有x86双雄的厮杀,也将上演顶级x86选手与UNIX王者的较量。

由于至强7500已经当前最强的x86处理器,而它又点名说要替代RISC,RISC这边的最强者则非POWER7莫属,那么今天我们就来看看两者碰撞到底有着怎样的表现。毕竟最终到客户手上,还将是以应用特性说话,这个特性包括了应用性能、应用的RAS、应用的综合成本等等,所有硬件与软件平台的设计都将最终为这一指标服务,而不同的用户对这一特性的不同组成部分的权重也各不相同。所以,不管是基于怎样的软件硬件架构,只要能符合相应的需求条件就有可能进入这一阶层用户的选购视野,由此也必将带来直接的竞争!

在下文中,我们将通过几个方面对双方进行一个较为全面而深入的对比分析,有时为了更好的帮助大家来理解,可能会引入相应的其他处理器产品,而文章中的性能数据均来自于英特尔、IBM、SPEC、TPC等官方数据,在此我们更多的只是一种整理与归纳,谨供大家参考。






基本规格与价格信息

首先,我们来看一看产品的规格与价格,这个价格基本也就是初期的采购价格,对于用户来说,心理影响不可谓不大。不过,处理器的性能指标也将让每个人心中都有一个权衡。为了便于比较,我们将AMD的石皓龙6100也纳入规格的比较范围,这理需要指的是,皓龙6100就定位来说完全没有挑战UNIX市场的企图,在此只是提供一参考,毕竟它也算是x86平台的顶级选择选手之一。

从规格上看,POWER7的设计的确强大,比如浮点运算性能(理论),是皓龙6100的2.3倍,是至强7500的3.3倍,而且在内存与I/O带宽方面也明显领先。8通道内存外加7个CPU互联及I/O通道,在数量上就比至强7500明显要多(至强7500有4个内存通道,4个互联及I/O通道),再平均到每个处理核心上时,其优势非常明显。不过在其他方面它肯定能感受到来自x86的威胁。至强7500较上一代7400有了极大的进步,在当前x86领域已经独领风骚,虽然在内存与I/O带宽上有所不足,可是在内存的扩展能力上已经不输给POWER7,这完全利益于基于QPI体系的NUMA架构设计,AMD的皓龙理论上也能具备这样的扩展能力,但由于英特尔引入了可扩展内存缓冲器(SMB,Scalable Memory Buffer),从而使其在这一子系统上的能力与POWER7相当了。而且,一些OEM厂商的独特设计反而会让至强7500在这方面更占优势,比如IBM自家的eX5服务器,通过MAX5内存扩展加速器,可以在4插槽的情况下让DIMM总量达到96个,是4插槽POWER7的1.5倍。一台x86服务器的内存容量是一台同插槽规模小型机的1.5倍,这在以前完全不可想象。

在价格方面,至强7500则就“完全不是对手”了,面对高昂的POWER7,只能甘拜下风。

至强7500家族的成员报价来看,最高的为3692美元,合人民币2.5万元左右,但是与POWER7比起来则只能是个零头。两颗POWER7 3.8GHz处理器+16个DIMM插槽组成的CPU插卡的报价为5.7万美元,每颗CPU的价格基本可以锁定在2.4万美元以上了,合每颗CPU大约16.5万元人民币,基本上是至强7500顶级型号的6倍多。从服务器报价上也能体会出POWER7的“贵”。


对于最新的至强7500服务器,从Dell官网上我们了解到,4插槽至强X7560+512GB内存满配(PowerEdge R910)的价格大约在8万美元左右,合人民币约55万元,基本上是Power 750服务器4插槽3.3GHz+128GB内存价格的一半,但请注意内存容量上,POWER750的价格配置只是至强7500满配的1/4。
到此,我们已经能对POWER7至强7500之间的规格与价格差有了一个比较明确的概念,POWER7在每CPU核心的内存平均带宽上是至强7500的两倍,CPU外连平均带宽是至强7500的3.2倍,而顶级型号上,POWER7的价格是至强7500的6倍,那么这些规格与价格上的差所带来的性能又会是怎样的表现呢?
 楼主| 发表于 2011-2-5 16:42:46 | 显示全部楼层
整数与浮点运算性能

为了便于比较,我们在这里挑选了比较有代表性的5款配置,其中POWER7有3款,至强7500为两款,至强7500均取最高性能数据。除非注明为AIX平台,否则POWER服务器的性能测试是基于Linux平台,两者差别并不大,但取性能优者列出。

SPEC整数性能测试

在整数性能测试中,4插槽时,3.3GHz的POWER7基本是至强X7560的1.27倍,不过8插槽的情况下,POWER7的领先幅度加大,是至强X7560的1.84倍,不过8插槽的Power 780用的是3.86GHz主频的CPU,不过仍然可以肯定即使是换成3.3GHz,也将超过1.27倍的领先幅度,这也能体现出POWER7架构在可扩展的性能损耗方面占优,4插槽的3.55GHz的Power 750是780的41%,而4插槽的X7560则是8插槽的57%,可见向8插槽扩展时,POWER7的性能基本没有损失,呈线性增长态势,这一点要比至强7500占优。

SPEC整数性能测试

在浮点性能测试中,POWER7的浮点性能体现出了更大的优势,4插槽的3.3GHz Power 755是4插槽X7560的1.36倍,而8插槽配置下,POWER7更是至强X7560的2.29倍,在线性扩展性能方面,POWER7仍然保持着良好水平,虽然8插槽与4插槽的CPU主频不一样,可是可以看出来,即使主频相当,也保持在1:1的插槽扩展性能水平上,而X7560从4插槽提升至8插槽后,浮点性能只提供了63%。

从4插槽与8插槽的整数与浮点性能基本对比上看,插槽越多,POWER7的优势越明显,也体现出了POWER7系统在可扩展性方面的高效率,这也说明了x86平台这方面仍然有很大的差距和改进空间。我想,这主要还是因为CPU互联带宽的制约上,POWER7在CPU互联上提供了6条链路,是至强7500不可比拟的。

 楼主| 发表于 2011-2-5 16:43:24 | 显示全部楼层
Java、ERP、OLTP性能测试

企业ERP应用SAP-SD 2-Tier测试结果

在SAP-SD 2-Tier的测试中,POWER7系统表现出色,体现出了小型机的性能本色,4插槽3.55GHz的配置下,成绩是4插槽X7560的1.5倍,基本上与8插槽的X7560相当了。而在8插槽性能下,8颗3.8GHz的POWER7使得Power 780的成绩达到了8插槽X7560的2.3倍。而从这个成绩上仍然可以看出POWER7所具备的优良的线性扩展能力,8插槽的3.8GHz配置是4插槽3.55GHz配置的2.37倍,而8插槽的X7560的成绩只是4插槽的1.53倍。

商用Java性能对比测试

SPEC Java Business Benchmark 2005是一款用Java编写的多线程测试工具,它的评测是模拟一个企业基于若干个仓库为多个客户提供交易服务的环境,以每秒的操作数(BOPS,Business Operations per Second)来评估性能。

在这个测试中,我们还没有拿到Power 780的数据,不过POWER750的表现仍然抢眼,是4插槽至强X7560的1.23倍,而且Java虚拟机的数量是4插槽X7560的两倍,而同样是32个虚拟机情况下,8插槽的至强X7560的得分则为1.34倍,如果按照POWER7线性扩展能力计算,8插槽3.8GHz的POWER780的成绩应该在500万左右,是8插槽至强7500的1.5倍。

TPC Benchmark C是TPC组织开发的一套OLTP(On-Line Transaction Processing联机事务处理)基准测试程序,与TPC Benchmark E的测试很类似,不过基准测试的业务模型有所不同,TPC-E是基于金融经纪公司的业务模型进行OLTP性能测试,而TPC-C是基于批发商的业务模型进行OLTP性能测试,不过基本上都能反映出系统的OLTP的性能,其成绩单位是TpmC,即每分钟的交易数(基准测试C)。

目前至强7500还没有参加这TPC-C的测试,我们只能拿其他的一些x86系统的成绩来作为参考。需要注意的是,POWER780参测配置只有两个插槽,采用两颗3.8GHz的POWER7,工作在Turbo Core模式下,此时POWER7的8个核心将关闭4个,剩下的4个将在总功耗不变的前提下进行超频至4.14GHz,之所以要做这样的设计是因为核心数量减半也将意味着软件的授权成本降低一半,当应用对于并行运算需求不大时,这种功能显然有助于提高系统的性价比。

这样,在双插槽8核心的4.14GHz POWER7的驱动下,Power 780取得与8插槽48核心X7460相当的性能,等效比为1比6。而双插槽24核心的皓龙6100平台的成绩为58%,而在TPC-E的测试中,4插槽至强7560的性能基本上是双插槽皓龙6100的2.17倍,因此我们可以大概推算一下,4插槽至强7500的TPC-C的成绩应该在150万TpmC左右,领先于参评的Power 780,但是以32核心为代价的,而对手只有8个核心。

每TpmC成本方面,目前双插槽的皓龙6100(HP的ML385G7)保持着季军的水平(前两名均为英特尔至强5500平台),成绩为0.60美元/TpmC,而POWER780是第5名,成绩是0.69美元/TpmC,也是目前唯一一个进入该项目前10名的UNIX系统,从这点来说POWER7用自己的高性能极大弥补了其高价格的缺憾,也体现出了强大的竞争实力。

 楼主| 发表于 2011-2-5 16:44:17 | 显示全部楼层
高性能计算测试

目前我们还没有获得有关POWER7的一些典型高性能应用软件的测试成绩,而只有SPEC的OpenMP的基准测试成绩,所以在此仅做一简单的比较。

OpenMP基准性能测试

从成绩数值上看,4插槽至强7560的OpenMP的性能要好于4插槽的Power 750和755,不过两者评测时的线程负载并不一样,可见128个线程OpenMP的线程并没有帮助Power 750获得更好的成绩,这也从侧面说明单核心4线程的SMT设计对于POWER7的HPC应用并不是一个很好的方案,但不知道主频提高到3.8GHz时会有怎样的表现。不过当进行极端优化后的Peak(峰值)测试成绩,Power 755则与未打开Turbo模式的至强X7560相差无几了。

STREAM Benchmark测试成绩(TRIAD)

STREAM Benchmark是一款非常著名的持续内存带宽基准测试程序,在这项测试中4插槽的Power 755的成绩为121GB,而皓龙6100表现不错,达到了110GB,不过这个成绩是AMD自己公布的,在Anandtech网站的测试中,双插槽6174的成绩在50GB/s左右,4插槽理论上也就是100GB/s,但与4插槽的至强7500相比还是有明显的优势。Anandtech网站所测试的至强7500平台是双插槽的Dell PowerEdge R810,成绩为24GB/s,但Anandtech网站说英特尔工程师表示双插槽的至强7500最高达到29GB/s的STREAM Benchmark成绩,所以笔者最后推测4插槽的至强7560的成绩为58GB/s。

可能有读者会问为什么POWER7的内存带宽那么高,成绩并不比皓龙6100强多少,而至强7500比皓龙6100内存带宽规格没差多少,但为什么在测试中会成绩明显偏低呢?原因在于POWER7至强7500在内存写入带宽上都有所缩小。其中POWER7的内存写入带宽是读取带宽的一半(写入数据位宽是读取数据位宽的1/2),理论为51.2GB/s,但8个通道的DDR3-1066则为68.2GB/s,这就出现了写入性能的瓶颈。而至强7500的单颗SMB的SMI南行数据通道为9条(从CPU的内存控制器发往DIMM),而北行数据通道为12条(从DIMM发往CPU内存控制器),所以SMB的读取带宽为9.6GB/s,写入带宽为7.2GB/s,而单通道DDR3-1066的写入带宽则为8.5GB/s,所以SMB在写入带宽上也存在瓶颈。反观皓龙6100,写入与读取带宽均相同为4通道DDR3-1333,约43GB/s,所以在内存读写综合效率上就占优了。

Anandtech网站给出的至强7500与皓龙6100的内和缓存的延迟、带宽测试数据

另一方面,由于至强7500引入了SMB的设计,虽然获得了极强的内存扩展能力,不过也在相应增加了内存的延迟,这也必然会对至强7500的内存性能产生一定的影响,但与所获得的内存扩展能力相比,对于高端企业级应用显然还是值得的。

 楼主| 发表于 2011-2-5 16:44:45 | 显示全部楼层
企业级RAS特性

RAS特性一直是小型机引以为荣的一个优势,由于传统的、高端的、封闭的企业级设计思路,小型机厂商的“RAS情结”一直很重,也因此它就像一个传统保留了下来,从目前来看也的确如此,有着更久远的POWER与SPARC小型机在RAS特性方面一直保持着依靠的地位,但英特尔主导的EPIC(安腾)与x86处理器(至强)则在这条道路上奋起直追,并进步迅速。

硬件企业级的RAS特性一直是小型机用来比较,也是打压x86处理器的一个重点,不过就像上文所说的,RAS特性与CPU是CISC、RISC还是EPIC架构完全没有关系,就看厂商如何在CPU处理核心的外围做文章了,比如更多的纠错保护、更多的冗余替换以及更为先进的配套软件支持等

POWER7的高可靠与高可用设计,毕竟对于CPU来说,并不涉及高可维护性,后者是对整体系统而言

此次新推出的POWER7在高可靠与高可用性方面,包括了以下主要的设计:

  • 动态双振荡器:有两个振荡器为处理器提供基准时钟(OSC0和OSC1)的失效备援

  • 高可靠的处理器与节点总线接口:具有ECC保护与节点热添加与修复功能的Fabric架构总线接口,用于连接其他的处理器或节点

  • 处理核心恢复:检测各主要寄存器的错误,并进行清除与重试,增加堆栈闭锁功能以改善软件错误率(SER)

  • 后备处理器恢复:核心检查站分区隔离

  • L3 eDRAM缓存:具备ECC保护功能、特殊的无法修正的错误(SUE,Special Uncorrectable Error)应急处理、缓存行删除以及备用的行与列寻址功能

  • GX IO总线:用于与IO集线器相连接,具备ECC保护以及热添加

  • 高能内存功能:具备标准的ECC/Chip Kill内存技术;可允许两个内存芯片失效;SUE应用处理;选择性的内存镜像功能用以在DIMM失效时进行分区恢复;PowerVM虚拟化管理器也具备全DIMM失效时的保护功能

而在至强7500方面,英特尔这次也准备了超过20多项的RAS功能,较上一代的至强7400可谓是革命性的进步。

至强7500的主要的22项RAS功能设计

与以往相比,至强7500的RAS特性已经有了很大的改观,在硬件功能上已经进步了很多,不过这里需要强调的是,服务器系统的RAS并不仅仅指处理器的RAS,还将包括软件方面的RAS特性,这方面POWER7则具备了较为明显的优势。

ITIC 2009年在全球范围内进行的服务器硬件与操作系统可靠性调查结果(一年中非计划停机时间)

在信息技术工业委员会(ITIC,Information Technology Industry Council)于2009年7月发布的服务器硬件与操作系统可靠性调查报告中,AIX+Power的组合获得了最好的成绩,平均每年的非计划停机只有15分钟,而基于x86系统的SUSE Linux大约是50分钟,RHEL Linux系统则在70分钟左右,至于Windows系统则将近170分钟,虽然这里有硬件系统RAS功能不强的原因,但基于x86系统的操作系统之间都有这么大的差异已经说明了问题,因此就软硬件总体而言,至强7500在硬件上的RAS努力也必须有一个在操作系统上配合与实践、成熟的过程,就目前来看,与POWER7系统肯定还有差距。

除了操作系统之外,虚拟化近年来已经越来越被客户认识并认可,而虚拟化层的软件在某种意义上讲,已经比操作系统更为重要,因为后者是部署在前者之上的,虚拟化层Hypervisor的效率将直接影响虚拟机的性能。所以,我们也有必要看看双方的虚拟化性能的表现。

 楼主| 发表于 2011-2-5 16:46:17 | 显示全部楼层
虚拟化性能对比

按照IBM的说法,IBM的Power系统在做基准性能测试时,都是基于其PowerVM虚拟化Hypervisor的,可见IBM对其虚拟化技术的自信,而在x86系统上我们也非常熟悉VMware、CITRIX与Hyper-V等Hypervisor。目前,我们还没有比较完整的POWER7至强7500基于不同虚拟化级别的可比测试数据,不过我们可以从以往的产品测试中来看看POWER系统与x86系统虚拟化对性能衰减的表现,并以此来看看双方虚拟化层的效率。

所谓的虚拟化性能衰减是指服务器在做虚拟化后的应用性能,相对于裸机时的应用性能的下降幅度,下降幅度越小,也就意味着虚拟化性能的衰减越小,虚拟化的效率越高,即系统进行虚拟化时的系统开销越少,而留给应用的处理资源(CPU/内存/IO等)越多。

双插槽Power 570的SAP虚拟化性能衰减对比

双插槽至强5500服务器的SAP虚拟化性能衰减对比

在SAP S&D 2-tier的测试中,以每核心的用户数为基准,我们发现POWER系统基本上没有因虚拟化而产生性能衰减,而在至强5500系统上,配合VMware最新的ESX(包含于vSphere 4),性能出现了比较大的衰减,当使用4个虚拟CPU时,较裸机性能下降了31.7%,而当虚拟CPU增加到8个时(到时与物理CPU核心数量相当),虽然测试结果较4个虚拟CPU更高,但每核心的性能则较裸机性能下降了38.7%,超过了1/3,可见系统的虚拟化开销是比较大的。不过,就裸机性能来看,至强5500有明显让人眼前一亮,已经明显超过了Power 570。

基于DayTrader的虚拟化性能测试结果

同样的性能衰减也出现在微软的Hyper-V平台上。首先是单个虚拟机不同数量的虚拟CPU的比较,这里采用的测试程序是DayTrader2.0,它是一个开源的基准测试程序,DayTrader2.0测试模型一个股票交易系统,基于Java EE技术构建,采用了外连的数据库架构,在测试中Power 550与至强5500服务器测试环境均搭配相同的数据库服务器(基于Power 570),数据库是DB2 2.97。对于测试结果我们暂且不看不同虚拟CPU个数时的性能差异,只看性能差异的变化值,从1个虚拟CPU过渡到2个虚拟CPU时,POWER与至强5500系统基本上都呈现了成倍的线性性能增长,至强5500甚至更明显(POWER的依靠幅度降低),但当虚拟CPU数量提高到4个和8个时,可以看出虽然两者的性能提升幅度不再像1到2个虚拟CPU时那样大,但两者间的性能差距在渐渐拉开,也就说明Hyper-V的虚拟化性能衰减更大了。

AIM7虚拟机测试结果

接下来是虚拟机数量的扩展性能对比测试,测试软件也是一个开源的基准测试程序——AIM7,它主要用来对服务器的CPU、内存与I/O子系统进行压力测试,而虚拟机数量无疑将增加对系统的负载,所以这个测试也将体现系统各功能单元对虚拟机数量的承载能力。还是不用看每个虚拟机数量阶段的性能差异,而是看差异变化的趋势。我们会发现POWER系统基本可以得到线性的增长,至强5500系统在1和4个虚拟机时表现还不错,甚至在4个虚拟机时与POWER的性能差距小于1个虚拟机的状态,但到了6个和8个虚拟机之后,两者的性能就开始拉大,也就意味着此时Hyper-V的虚拟化性能衰减开始越来越明显。

以上测试基本能反应出了PowerVM与x86上的ESX、Hyper-V这几个Hypervisor的效率差异,PowerVM在系统资源的调配与管理上要更为成熟高效些,因此也让IBM有底气可以在PowerVM虚拟化层上进行企业级的基准性能测试。此外,在虚拟机层的具体功能与管理能力方面,双方也有差距,但由于不是本文的重点,所以就不再此详述了。我们将在日后的相关文章中,进行重点的介绍。

回到至强7500,由于它在虚拟化功能上与至强5500平台相差不太多,所以我们认为以目前的x86虚拟化技术水平,若想在虚拟化层上部署关键或重量级企业应用,至强7500相对于POWER7,至少在性能衰减方面还是会有差距的。

 楼主| 发表于 2011-2-5 16:47:26 | 显示全部楼层
总结:至强7500到底动了谁的奶酪?

通过本文的一些粗略的对比,大家现在对于至强7500的RISC替换市场的战略有了怎样的认识呢?
首先,虽然我们只是主要从硬件和性能层面进行了对比,而没有深入到POWER与x86的软件与整体的系统环境层面进行分析,但就像我们早前的POWER7专题中所说的那样,在综合性能与实力方面,POWER7的推出的确起到了“以正视听”的作用,再次确立了小型机在单机性能与综合素质上的地位,这一点就上文的对比情况来看也是毋庸置疑的。
然而,我们也不能不看到POWER7相对于POWER6的巨大进步帮助了POWER家族在性能上保持优势,其相对于POWER6系统达4倍以上的性能提升,才换取了如今的王者地位,也不能不说是一种革命性的进步。现在再回头看看本文开头的那张至强5500与POWER6系统的基础性能对比的图片,就能感觉到,如果POWER7相对于POWER6没有达到如此大的进步程度,那么至强7500无疑将会给POWER系统带来巨大的压力,我们只需举一个例子便能说明问题。

从这张笔者修改的POWER7的PPT性能对比图中,我们就看出至强7500在当前企业级市场的能力,基本上已经与32插槽的Sun M9000相当了,但你是否知道POWER6在其中的位置呢?我告诉你,至强7500的成绩也已经超过了16插槽POWER6 4.2GHz(Power 570,32核心)的成绩

仍然是经典的SAP S&D 2-tier测试,IBM在其POWER7的介绍文档中引入了4插槽Power 750的测试成绩来对比其他系统。其中Sun的M9000系统采用的CPU是目前最新的SPARC64 VII, 主频2.88 GHz,每插槽4核心,SAP S&D 2-tier测试成绩为17430,而16插槽的POWER6 4.2GHz(Power 570)则为14432。

所以,虽然至强7500的综合性能较POWER7还略逊一畴,但已经超越了POWER6(虽然就单核性能来说还不如POWER6,这主要与CPU主频以及CPU的平均内存与I/O带宽等外围设计相关)和SPARC64 VII,这对于至强系统来说是不可想像的,要知道8插槽的至强X7460(2.66GHz,共48核心)的成绩才是9200(IBM System x3950M2)。因此,本文的对比并不能遮盖至强7500的光芒。

而且,我们也能发现,即使是AMD的6核心的伊斯坦布尔也有不错的表现,48核心的Sun X4640的测试成绩是10000,所以如果把POWER7拿开,x86系统至少在性能上已经比较有竞争力了。然而,如果全面来考量的话,AMD系统在RAS特性肯定就会刷下来了。所以我们还是把目光拉回到至强7500身上,回到本文的核心话题——至强7500的RISC替换战略的前景如何。

综上所述,至强系统从总体的综合性能与健壮性来说,与当前的POWER7系统仍然有差距,这也就意味着,要想从POWER手中去抢夺RISC市场份额,难度很大。有人可能会说至强7500系统的价格很有优势呀,这是没错,但这更多的用处在于吸引那些临界用户,即原来没有RISC系统资源,但可能蠢蠢欲动想尝试小型机的那部分客户,至强7500所体现出来的性价比就相当诱人了,它的系统价格至少是同等配置的POWER7系统一半,性能肯定不会被落下一倍,而对于POWER6来说性能还有优势,RAS与虚拟化方面比POWER是差些,但比其他的x86系统要强多了。

可是,对于那些已经有POWER或其他小型机系统的用户来说,至强7500的影响力就大幅降低了,这主要缘于用户的应用惯性,它将是至强7500的RISC替换战略得以顺利实施的最大阻力!

所谓的应用惯性,是指用户建立起来的应用系统环境,如果没有问题就不会轻易改变,就像一般的桌面用户不会舍弃Windows而用Linux一样。尤其对于大企业来说,系统的稳定比性能更为重要,这也是为什么小型机的厂商和用户都非常看重RAS的原因。所以已经部署POWER系统的用户,只要系统不出大问题,或是用起来极不顺手,就不会想跳槽到别的系统架构下,因为很有可能凑合用没出问题,但做系统迁移反而出来一堆问题,这对于企业客户是得不偿失的。

再者,用POWER小型机的客户大多不差钱,在需要做系统升级时,有POWER7在,基本也就不会考虑其他的架构了。根据IDC的数据,即使在2009年金融危机闹得最厉害的时候,中国的小型机销量仍然不降反升,从中可以看出小型机仍然有着坚固的市场需求。

不过,有一种例外就是当用户感觉到自己的系统未来前景不明朗时,就有可能考虑改变自己的应用架构。比如Sun,这个可怜的UNIX服务器大厂,在与Oracle的联姻的漫长拉锯战中,也消耗了用户的信心,由于Sun的SPARC处理器发展路线图变得十分不明确(不像IBM现在就已经放风2013年推出POWER8,POWER9也在路上),所以在2009年,Sun的UNIX市场份额丢失的最为明显,其损失掉的部分有不少也就转移到了x86系统上,在这方面Dell就坦然表示,2009年所争取到最多的UNIX迁移客户就来自于Sun的领地。

至于另一个UNIX大厂HP,虽然处理器的性能不如POWER,更新路线图也没有IBM清晰,但由于用户的应用惯性,也能得到较好的支撑。就这点来说,UNIX服务器的升级换代更多的是为老用户准备的,这类用户只要性能不要太差,只要你能一直保持更新,他们就基本不会考虑改投他门,这也是为什么即使第三代安腾(Tukwila,Itanium 9300)的性能不被业界看好,但对于HP-UX、OpenVMS和NonStop用户来仍然吸引力的根本原因。

不过说到安腾3,可能就引出了另一个也许会影响用户转变应用架构的推动力,那就是性能与性价比,在本文发布的时候,也正好赶上HP公司发布最新的Integrity Superdome 2服务器。虽然应用惯性会是一个重要的维系用户的一个因素,但如果性能与性价比已经达不到用户需求的底线,那么转变架构的变数也将增加。而安腾3也许就是这样的一个“案例”。

在HP发布Superdome 2的同时,TPC网站也悄然出现了Superdome 2的TPC-H的测试成绩,TPC-H是一个比较冷门的基准测试,它用来考查系统在决策支持方面的性能,下面我们来看看Superdome 2的表现。

安腾3处理器的基本整数与浮点性能对比

HP发布Superdome 2的TPC-H测试结果对比

需要指出的是,与Superdome 2性能相近的成绩并不多,我们只是找了两个与之接近的测试成绩,比Superdome 2高两位的是一套由40台单插槽至强X5365组成的集群,共40颗CPU,80个核心,640GB内存,成绩为580729,单位性能成本为1.72美元。IBM自从POWER5之后就没有参加这一级别的测试,所以我们还不能准确的判断其与POWER6/7之间的性能对比,但从这样的成绩来看,Superdome 2的性能似乎并不理想,按照4插槽的至强7500性能强于8插槽的AMD伊斯坦布尔的成绩来推断,笔者相信4插槽的至强7500(32核心)的性能应该比Superdome 2差不了多少,这也就基本上能给安腾3定个基调了,虽然它的性能是上一代安腾2的两倍,但与竞争对手相比,进步还是太慢了,这或多或少会影响安腾用户的心情。

英特尔认为,至强7500与安腾3一块将会共同侵占RISC市场,让更多的RISC用户迁移到IA架构上来,但对一说法我是比较怀疑的。即使是Sun用户,想脱离SPARC体系,是不是就会选择安腾3呢?上有更高的POWER7,再往下有各方面表现都比较均衡,且性价比更高的至强7500,安腾3则处在一个比较尴尬的位置,而且它本身也将受到POWER7至强7500的围攻,虽然英特尔更多的强调RISC替换而不是UNIX替换,虽然HP也有自己的至强产品线,虽然IBM可能出于自身的POWER利益也不会太过宣传其至强7500产品线,但别忘了还有Dell这个“无UNIX一身轻”的重量级选手,从它的至强7500产品线的宣传页面中,关联一大堆教用户如何从Sun的SAPRC服务器迁移到至强7500平台的PDF文档这一阵势上,就能看出Dell的野心。而就UNIX市场来说,Sun与HP还有IBM是一条船上的,是RISC还是EPIC架构,并没有本质的区别。更何况,POWER7至强7500的性能与RAS还要强不少,从感受层面上,似乎也更容易打动那些高端的安腾客户,毕竟都是UNIX用户嘛。

所以,至强7500个x86终极武器投放出去之后,其具体的竞争指向英特尔也很难控制,完全不排除抢自家安腾3地盘的可能,而且安腾3面对POWER7的竞争(分两个层面,一个是共同争夺Sun的客户,一个就是两者之间的用户争夺),又能有多大优势呢?因此在笔者看来,英特尔希望用安腾3和至强7500一块冲击RISC市场的想法,多少有些一厢情愿。

总而言之,至强7500毫无疑问是一款非常优秀的企业级高端x86处理器,其在性能与RAS方面相较前一代的至强7400获得了极大的提升,在x86市场上就综合实力来看,已无对手,但要想冲击UNIX市场,还是有相当的难度,它不仅要面对强大的对手,还要与用户的应用需求做斗争。正如IDC中国企业级系统研究部分析师史婧所指出的——RISC(这里泛指UNIX服务器)在传统行业(如电信、金融等)还是具有不可替代优势的,虽然像多家厂商推出了至强7500这样的高端处理器,并且可能和RISC市场群体有一定的交叉,但不是很多。

笔者相信,这个所谓的相交叉市场,就是至强7500所将争取的奶酪。在未来的市场竞争中,至强7500将会在Sun的“奶酪”中有最大的斩获,其次嘛……很有可能就是英特尔自家的安腾领地,至于POWER市场将是最难啃的一块奶酪。而高端用户传统的应用惯性,也将在很长一段时间里,继续保持着传统UNIX服务器的固有领地,同时,新兴的应用与服务模式,如云计算等,也会带来新的应用需求,并使服务器架构的分野进入一个全新的格局。

英特尔在IDF 2010北京大会上所引用的IDC的预测真的能实现吗?就让我们拭目以待吧!

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|boway Inc. ( 冀ICP备10011147号 )

GMT+8, 2024-4-25 00:32 , Processed in 0.108729 second(s), 16 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表