从2000年Intel推出Pentium 4以来,NetBurst架构已经走过了6个春秋。坦白说,并不优秀的架构能够有如此长久的生命力着实令人惊讶。事实上,在Pentium 4刚推出的时候,为了提高主频而采用过多的管道设计就一直受到争议,甚至在与当时的上一代主流产品Pentium 3比较时根据就体现不出性能优势。在Intel的微处理器产品线上,从技术角度去看,经典产品还是要数Pentium系列的I、II、III代处理器以及移动领域用于迅驰平台的Pentium M处理器。
直至今天,Intel终于解开束缚,向NetBurst架构说拜拜,奔向前景无限的Core怀抱。2006年第三季度,Intel将发布新一代的、基于Core架构的个人桌面处理器——Conroe。
Conroe处理器,将会是Intel今年下半年的重头戏,它摒弃了以高流水线、高频率为主的NetBurst架构,采用了类似于Pentium M Banias的短流水线、低功耗设计。Core架构处理器,让Intel重新回归正道。
Conroe处理器,是Intel新一代的的双核心处理器,虽然保留了FSB(前端总线)的概念,但核心架构上已经做了相当大的改进。Conroe处理器采用的是共享二级缓存设计,有效的避免了目前SmithField、Presler双核处理器需通过前端总线才能相互访问的瓶颈,直接式L1对L1的资料交换,更是加强了处理器的Pre-fetch和Memory Disambiguation能力,绝对是处理器架构上的一次大革命。另外,增强型的浮点运行能力,SSE4多媒体指令集,为Conroe增加不少制胜的筹码。

为了便于与前代Intel双核处理器的区分,Intel下一代桌面处理器Conroe以及下一代笔记本处理器Merom都将在今年第三季度发布时采用相同的品牌命名——Core 2 Duo。另外,Intel最高性能的桌面服务器芯片Woodcrest将命名为Core 2 Extreme,以区分于普通桌面/笔记本处理器产品。

“Pentium”正式成为历史,迎接我们的是脱胎换骨的“Core 2”
Intel全球市场开发部门经理Eric Kim将Core 2比喻为计算机的“心脏以及灵魂”,为数字生活带来不可思议的变化。
我们DIY配件栏目有幸,在第一时间内获得两款基于Core架构的Conroe处理器(工程样本),它们分别是Conroe E6300和Conroe E6400。

你能猜出哪颗是Conroe吗?

在一睹她们芳容前,我们买个关子,先为大家简要的说明一下Intel Core架构,在技术上到底有哪些重大的改进。
Core构架技术简要回顾
2005年秋季的IDF上,INTEL正式宣布将采用全新构架的CPU来取代当前Netburst构架的Pentium 4系列,从笔记本使用的移动CPU到桌面CPU再到服务器的XEON系列,全部都将放弃现在的Netburst构架。Netburst在2001年5月登场取代P6构架的4年后,终于完成了它的历史使命,将燃烧的火炬交给了它的接班人。

在过几年里,大多数CPU都远离了乱序执行方式(OOOE)的内核设计思路,而偏向了有序执行(IOE),大量的VLIW处理器的性能都严重受限于程序与编码器,而现在Core的出现则代表了INTEL当前OOOE方式的最高设计水平,INTEL宣称Core将比现有的IOE处理器更好更合理的迅速处理完数据。

从Core的设计图我们可以看见,Core构架的每个环节都比过去的CPU更大更宽,它的向量和标量执行单元要比过去的Netburst构架大的多。更多更大似乎成为了Core设计组的核心思想-更大的DL解码逻辑电路、更大的RBS重排序缓存、更大的RS预留缓存、更大的数据输出口,更多的晶体管、更多的缓存,INTEL把一系列强大的硬件条件集合在了Core一体。
Core拥有一系列方法来解决ILP限制的问题,在数据前期处理方面有宏指令融合(Macro-Fusion)、微指令融合(Micro-ops Fusion)、分支预测单元(Branch Prediction Unit)等来保证编码快速送入到正确的执行单元,而在数据输出端则有主够的指令输出窗口(Instruction Window)来有序的分配每个流水线的任务,INTEL还特别提到他们已经改进了SSE指令中的一个重要缺陷,可以极大提高效率,以上这些多方面的全面改进使得Core的运算能力要比过去Netburst构架的CPU强大的多。
1、Core的整数与浮点执行核心
为配合Core增多的32条预留缓存空间(Reservation Station),Core的执行核心(Execution Core)也拥有了重新设计的数据输出端口(Issue Port) ,相比P6的5个端口及Netburst的4个端口,Core拥有了6个数据输出端口。其中3个端口专门负责指令执行单元,这将更好的满足现时CPU的巨大数据传输需要。

Core的整数执行单元 Integer execution units
Core拥有3个64-bit整数执行单元(Integer Execution Units),每个单元可以独立处理一条64-bit整数数据,这样Core就有了一套64-bit的CIU复杂整数单元(Complex Integer Unit),这和P6构架相同。然后Core另外有2个SIU简单整数处理单元(Simple Integer Units)来快速运算较简单的任务,其中一个SIU将和分支执行单元BEU来共同完成部分的宏指令融合micro-ops fusion。上图中斜体字的部分尚未确定
对于INTEL的X86 CPU来说,这是首次可以在一周期内完成一阶64-bit的整数运算,这使Core已经走到了IBM PowerPC 970的前面-PowerPC 970需要有2个周期的延迟。另外,因为3个IEU整数执行核心使用了各自独立的PORT数据出口,所以整个Core处理器可以在一周期内同时执行3组64-bit的整数运算。
有着如此强大的整数处理单元,Core在性能上将比现有Pentium 4快的多,它在移动平台、服务器、3D图形上4倍于Pentium 4的性能表现将使全世界对INTEL CPU眼目一新。
Core的浮点执行单元 Floating-point execution units
Core构架拥有2个浮点执行单元(Floating-Point Execution Units)同时处理向量和标量的浮点数据,位于PORT 1的FPEU-1浮点执行单元负责加减等简单的处理,而PORT 2的FPEU-2浮点执行单元则负责乘除等运算,这样在Core中就将FADD/VFADD和FMUL/VFMUL划分为两组,使其具备了在一周期中完成两条浮点指令的能力。
2、Core的向量执行单元
真正128-bit的向量执行单元 True 128-bit vector processing
当INTEL最初兼容128-bit向量执行时,情况可能和编程人员及用户所预想不太一样,采用在P6和Banias构架上的SSE、SSE2和SSE3有2个重大的弱点,在ISA指令集架构方面,SSE最主要的缺点就是不支持3指令运算(Three-Operand),而支持Three-Operand的AltiVec则成为了当时更好的ISA。
P6构架的内部浮点处理和MMX都只有64-bit的带宽,所以进入SSE执行核心的只能是64-bit数据。为了让64-bit的SSE来处理128-bit指令,P6构架必须把128-bit的数据切割为2个64-bit的连续部分来处理。

这样折衷的处理方案使P6构架在处理128-bit数据时增加了一倍以上的延迟,而当时PowerPC G4的AltiVec只需要1个周期就能完成。同样不幸的是,Netburst的Pentium 4和Pentium M构架也都有这个弱点。

全新的Core终于拥有了一个周期完成128-bit向量运算的能力,INTEL终于把浮点和整数运算的内部带宽扩大到了128-bit,这不仅改进了延迟一周期的缺点,只有过去半数的微指令处理量也同样提高了解码、派址和带宽利用等多方面的速度。
这样全新构架的CPU将可以把128-bit的大量multiply/add/load/store/compare/jump等6套指令集成在一个周期中全部完成,其运用性能的飞跃幅度可想而知。
3、Core的内部线程
Core的流水线
INTEL还不能透露Core具体的流水线详情,目前我们只能告知Core采用14条流水线-这和 PowerPC 970是一样的,而之前的Pentium 4 Prescott拥有30条,P6构架为12条。短的流水线意味着Core在频率上的提升只能是缓慢的,而不能够像Pentium 4那样急速上升。
也可以这样猜想,其实Core的流水线设计和P6构架中的流水线是一模一样的,额外多出来的2条流水线完全是为了预留下CPU频率提升的空间而已。2条新的流水线各自成为Core流水线的入口和出口,成为了宏指令融合(Macro-Fusion)、微指令融合(Micro-Ops Fusion)等整合技术的输送站。
Core的内部出口
Core的ROB重排序缓冲区( Reorder Buffer)和RS预留缓存(Reservation Station)要比过去的Pentium M大了接近一倍,而事实上还必须考虑到新的宏指令融合(Macro-Fusion)、微指令融合(Micro-ops Fusion)等高效率的融合技术,这样以来,Core的内部转接速度至少要比Pentium M提高了3倍以上。
Core的处理前站-指令解码
下图为P6构架的指令解码环节,它内置2组SD简单编译器(Simple/fast Decoders)和1组CD复杂编译器(Complex/slow Decoder),2组SD简单编译器负责将简单X86指令转换至Uops微指令(Micro-ops)然后传送到MB微指令缓冲区(Micro-op Buffer)。复杂编译器可以编译4个Uops微指令,而一些类似字符串处理的旧式复杂任务还要通过专门的ME微码引擎(Microcode Engine)来转换为更加复杂的微指令,这些微指令再同时输入到MB微指令缓冲区等待下一步重排序。

这样的P6构架共有3个编译器每周期能执行6条Uops微指令,传送到MB微指令缓冲区,然后MB微指令缓冲区每次再传送3条微指令到ROB重排序缓冲区。

对于分支构架比P6宽的多的Core而言这样的旧式微指令处理能力是不够的,所以INTEL在Core中多加入了一组简单编译器(Simple Decoders),并且将MB微指令缓冲区的出口被扩宽至同时传送4条微指令。而更特别的是,过去需要堵塞着等待CD复杂编译器处理的许多内存和SSE数据现在可以由简单编译器来处理了,这都得宜于新的MIF微指令融合技术(Micro-ops Fusion)和改进的SSE,在下文中会详细介绍。
4、Core的指令融合技术
宏指令融合
Core前端处理环节新的突出能力是宏指令融合(Macro-Fusion),可以把多个X86指令融合在一起发送到到一个编译器转换为一个Uops微指令。多种指令将可以被融合,其中特别将compare和test指令融合到了分支指令(Branch Instructions)中。4个编译器都具有融合能力,但整个单元每周期只能完成一次宏指令融合。

除了在占用更少ROB和RS的情况下,宏指令融合(Macro-Fusion)还节约了内核前端的带宽,Core的解码单元能比过去快的多得清空IQ指令列队(Instruction Queue),而内核执行带宽也同样宽阔了很多,因为单个的ALU能同时执行2个X86指令,这些综合性能的提高使Core的实际处理效率比P6构架要提高多倍,远高于其可见的硬件单元增加幅度。

微指令融合
MIF微指令融合早先在Pentium M构架上就已经采用过,它和MF宏指令融合有着相似的功效,但是原理完全不一样。SD简单编译器(Simple/fast Decoder)把接收的单条X86指令转译为两条微指令,连接的两条微指令通过ROB发送到RS后,RS将把两条微指令分开来传输到不同的PORT中,平行的双通道同时传输,也可以是单通道的连续传输,这则取决于具体的处理情况。相对旧的MIF微指令融合技术,新的MIF支持了PORT的连续传输。
同宏指令融合技术相结合,Core构架在ROB和RS最大效率的流通更多的微指令、指令执行单元的处理速度和能力也极大提高的同时,反而占用了更少数量的硬件,这符合了Core高效率低功耗的设计原则。
5、Core的分支预测单元
在性能与能耗的平衡决策中,INTEL最终在Core的BP分支预测单元(Branch Predictor)上投入了大量的晶体管。
作为连接内存和CPU的重要环节,在BP分支预测上投入宝贵的晶体管资源是十分值得的。相对于预测错误后让CPU浪费时间和电耗来等待再次预测,一次准确的预测不仅仅节约了处理时间、提高了性能,也同样降低了CPU的功耗。
Core的三重分支预测单元实际上与Pentium M的预测单元是一样的,在Core的分支预测核心中存在一个双模态预测器和一个球型预测器,这些预测器记录下过去的执行历史并随时通知内核前端的ROB和RS,ROB和RS从BTB分支目标缓冲器(Branch Target Buffer)中快速取回所需要的数据地址,常规预测如通知一个分支在循环中仅在奇次迭代发生, 而不在偶次迭代中发生等, 这些在动态执行(P6系列)处理器上的静态预测技术还有有着长远的发展空间。
Core的分支预测单元拥有新的预测器- 循环回路预测(Loop Detector)与间接分支预测(Indirect Branch Predictor)。
循环回路预测
分支历史表(Branch History Tables)不能够记录下足够详细的循环回路历史来准确预测下次的运算,所以每次循环回路的运行都浪费了大量的亢余时间。 循环回路预测(Loop Detector)则可以记录下每个循环回路结束前的所有的详细分支地址,当下一次同样的循环回路程序需要运算时,内核前端的ROB和RS就可以以100%的准确度来快速完成任务,Core构架拥有一个专门的运算法则来进行这种循环回路预测。
间接分支预测
间接分支预测(Indirect Branch Predictor)在运用时并不是立即分支,而是从寄存器中装载需要的预测目标,它实际上是一个首选目标地址的历史记录表。在ROB和RS需要间接分支的时候它就可以提供帮助,ROB和RS就可以快速提取到适用的结果,这与P6构架用可预测的条件分支替换间接分支来改善性能是相反的。
6、Core的存储器改进
乱序执行OOOE必须有序输出BIO的一个简单原因就是:存储器未确定其它操作全部结束前是不能轻易修改一个存储单元的。

类似之前SIMD的8位、16位、 32位读写操作与MMX64位读写操作相混淆,及对同一存储区域先大数据量存贮然后小数据量读取或对同一存储区域先小数据量存贮再大数据量读取的情况,多种操作都可导致动态执行处理器的阻塞,虽然总体上只有3%的机率会出现存储混淆的错误,但过去的构架为预防存储混淆和堵塞采用了极其保守的方法-等待,这样就有大量的周期都浪费在存储器等待上。

在新的Core构架中,INTEL的设计师们使用了成熟的Memory Disambiguation技术,可以让存数和取数指令同时进行乱序执行而不用等待前排取数/存数指令的完成。这一优化使Core构架节约了大量的亢余周期,使其浮点存储器环节速度显著加快。
全新Core架构,Intel Conroe E6400现身评测室
Conroe E6400

(图片部分已作模糊处理)
采用全新65nm制程的Conroe E6400处理器,依然沿用LGA775接口,由于产品尚属ES(工程样本)阶段,处理器的编号命名规范尚未确定,因此,我们只能在第三行编号的末尾字段“4M”中,来区分该款处理器的二级缓存容量。

Conroe处理器的背面也与Pentium 955XE大有不同
Conroe E6300


Conroe与前两代顶级旗舰处理器的终极大图鉴


在这里,我们可以清晰的对比这三款处理器的外观差异。(从上到下,从左到右分别是:Conroe E6300、Pentium 955XE、Pentium 840XE )
烽烟再起,Conroe能否帮助Intel重夺双核性能王座?!

虽然Intel方面已经火速转阵至65nm制造工艺,但基于31级流水线、NetBurst架构的Pentium 955XE处理器却一直生存在AMD Athlon64 FX-60的阴影下,郁郁不得志。协同大量技术与架构革新的Conroe处理器,能否一洗怨气,重夺双核的性能王座?我们马上为大家揭晓……
CPU-Z中的处理器详细信息
Conroe E6400

1.33.1版的CPU-z,能帮助我们更为直观的认识Conroe处理器。Intel Conroe E6400处理器处理器,采用全新的65nm工艺制造、双核心设计,核心代号为Conroe,继续沿用LGA775接口,主频为2.13GHz;外频为266MHz,倍频为8x;一级数据缓存为32KBytes,二级缓存为4096KBytes(虽然Conroe E6400为双核处理器,但由于处理器共享二级缓存,因此没有Pentium D系列的每核独占多少二级缓存的说法);1066MHz前端总线,支持MMX、SSE、SSE2、SSE3、SSE4(暂定)多媒体指令集,值得一提的是,Conroe处理器还具备了EM64T 64位运算指令集以及Virtualization(虚拟化)技术。(注:Specification中的Pentium(R) D CPU 000标识是由BIOS信息提取,并非CPU的实际名称)
由于这款Conroe E6400处理器尚属工程样板阶段,核心电压方面仅为1.232v,核心步进则是A1。

Intel Conroe E6400 处理器的二级缓存方面,则采用全速16路64 Bytes的方式实现,双核共享4096 KB(4MB),无需类似上代Intel Pentium 955XE、840XE等,需要通过北桥芯片才能实现两个处理核心的信息交换。
Conroe E6300

Intel Conroe E6300处理器处理器,同样采用65nm制造工艺、双核心设计,核心代号为Conroe,LGA775接口,主频为1.86GHz;外频为266MHz,倍频为7x;一级数据缓存为32KBytes,二级缓存为2048KBytes;1066MHz前端总线,支持MMX、SSE、SSE2、SSE3、SSE4(暂定)多媒体指令集,以及EM64T 64位运算指令集、Virtualization(虚拟化)技术。

Intel Conroe E6300 处理器的二级缓存方面,与Conroe E6400有所不同,使用的是全速8路64 Bytes的方式实现,而不是Conroe E6400的全速16路设计,双核共享2048 KB(2MB)二级缓存,莫非Conroe E6300是由屏蔽了二级缓存的Conroe 4兆版本而来?
测试平台及说明
|
测试平台 |
|
CPU |
Intel Conroe E6400(LGA775、2.13G、4096K SmartCache L2) 266x 8=2130MHz (DDR2 800 5-5-5-15)
Intel Conroe E6300(LGA775、1.86G、2048K SmartCache L2) 266 x 7=1860MHz (DDR2 667 4-4-4-16)
AMD Athlon64 FX-60(Socket939、2.6G、1024K L2 x2) 200 x 13=2600MHz (DDR400 2-3-2-6)
|
|
主板 |
磐英 946GZ For Conroe E6400
磐英 8E975X-T For Conroe E6300
DFI NF4 SLi-DR Venus |
|
内存 |
Kingston DDR2-900 512Mx2
Geil Ones DDR600 512Mx2 |
|
硬盘 |
日立7K250 SATA 250G (7200转、SATA300) |
|
显卡 |
XFX(讯景) 7800GT
ATi Radeon X1900XTX |
|
软件平台 |
|
系统软件 |
WindowsXP Professional SP2 英文版 + DirectX 9.0C |
|
驱动程序 |
主板:Intel 7.2.2.1006
显卡:nVidia ForceWare 驱动84.21 WHQL |
|
|
- BAPCO SYSmark2004 SP2
- Business Winstone 2004
- Multi-Media Content Creation Winstone 2004
- SISoftware Sandra 2005
- Super PI MOD-1.4 English
- CPUMark 99 Ver1.0
- Everest
- WinRAR
- CineBench 2003
- TMPGENc 3.0 xPress
- Madonion 3DMark 2001SE Ver:330
- Futuremark 3DMark 2003 Ver:360
- Futuremark 3DMark 2005 Ver:120
- Futuremark 3DMark 2006 Ver:102
- Farcry
- Doom3
- Half Life2
- F.E.A.R
- Serious Sam 2
- Quake 4
|

国内首款支持Conroe处理器的i975主板——磐英 8E975X-T ,关于这款主板的详细介绍,大家可以点击下面的文章链接《民族品牌!最便宜的磐英i975主板评测》。

由于两款Conroe处理器先后抵达评测室的关系,因此,在Conroe E6400的测试中,我们采用的测试主板是来自磐英的946GZ工程样本,同时,也由于是工程样本的关系,该款主板并没有对1066MHz前端总线以及DDR2-800等规范的支持进行封锁,我们可以更为贴近的观察Conroe处理器的实际效能。主板的详细介绍,请点击下面的文章链接《支持Conroe国内首款946GZ工程样本现身》。
对比测试-办公、多媒体性能测试
BAPCO SYSmark2004 SP2
Sysmark 2004 是 BAPCO出品的权威性测试软件,它通过对一些常用软件进行实际使用,从而比较真实的反映出系统性能。因此这款软件的测试结果在日常应用中极具参考价值。SYSMark 2004由两部分组成:Internet Content Creation和Office Productivity。SYSMark 2004的测试成绩一共产生6组测试结果, Internet Content Creation和Office Productivity各产生三组。最后根据两个部分的分数整合成为总分。下面是Sysmark 2004 使用到的软件列表:
Adobe After Effect 5.5
Adobe Acrobat 5.0.5
Adobe Photoshop 7.01
Adobe Premiere 6.5
Microsoft Access 2002
Microsoft Excel 2002
Microsoft Internet Explorer 6
Microsoft Outlook 2002
Microsoft PowerPoint 2002
Microsoft Word 2002
Microsoft Windows Media Encoder 9 Series
Discreet 3ds max 5.1
Macromedia Dreamweaver MX
Macromedia Flash MX
Network Associates McAfee VirusScan 7.0
ScanSoft Dragon Naturally Speaking 6
WinZip Computing WinZip 8.1
SYSMark 2004 Overall

Internet Content Creation

Office Productivity

为了能更为贴近用户日常工作或生活所接触到的办公类应用软件,SYSMark2004利用了大众都相当熟悉的Office、Excel以及Outlook等办公软件,模拟了一套具备大量多任务处理的SYSMark2004系统测试工具。经过接近两个小时的测试,最后给出相应的参考分数,通过对比总分Overall以及Internet Content Creation、Office Productivity两大分项目的成绩,充分体现出这三款处理器在实际应用中的性能差异。根据我们以前的测试经验,两款频率只在2GHz附近的Conroe处理器,性能强悍得实在有点“过份”。以Conroe E6300为例,257分的SYSMark2004总分成绩,已经相当于前代Pentium D或Pentium XE双核处理器时钟频率为3.6~3.8GHz时的成绩,紧逼着AMD目前在Socket939平台上的旗舰产品——FX-60。当频率及缓存的稍稍提升,Conroe E6400就迅速摆脱Athlon64 FX-60,将其远远的甩在背后,前后的性能提升竟高达12.8%!
Business Winstone 2004
Business Winstone 2004是一个系统级的基于办公应用软件的基准测试,对以下常用的办公软件的实际应用进行考察:
Microsoft Access 2002
Microsoft Excel 2002
Microsoft FrontPage 2002
Microsoft Outlook 2002
Microsoft PowerPoint 2002
Microsoft Project 2002
Microsoft Word 2002
Norton AntiVirus Professional Edition 2003
WinZip 8
其中Business Winstone常规测试中是分项对上述软件进行测试,而Multitasking Test则是对多任务应用环境的测试。

与前面的SYSMark2004所类似的情况发生在Business Winstone 2004的测试当中。
Multi-Media Content Creation Winstone 2004
Multimedia Content Creation Winstone 2004是一个系统级的基于多媒体应用软件的基准测试,主要针对下面的几个多媒体应用软件进行测试:
Adobe Photoshop 7.0.1
Adobe Premiere 6.50
Macromedia Director MX 9.0
Macromedia Dreamweaver MX 6.1
Microsoft Windows MediaTM Encoder 9 Version 9.00.00.2980
NewTek's LightWave 3D 7.5b
SteinbergTM WaveLabTM 4.0f

Multimedia Content Creation Winstone 2004是一个系统级的基于多媒体应用软件的基准测试,在这里,战况有逆转的势头,在上述两个项目中优势明显的Conroe E6400显得有些吃力,Athlon64 FX-60展开了首轮攻击,并取得阶段性的胜利。当然,我们也要注意这一点,Conroe处理器时钟频率的提升对测试成绩的影响十分重大,因此,我们估计,2.2GHz的Conroe就能完全取缔频率“高达”2.6GHz的Athlon64 FX-60。
TMPGENc 3.0 xPress
TMPGEnc 是日本人堀浩行开发的一套MPEG编码/工具软件,支持VCD、SVCD、DVD等各种格式。TMPGENc 3.0 xPress相对于旧版本在MPEG编码上作了不少的优化,例如加入的超线程和多核心的优化选项,尤其是其加入了SSE3指令集的支持,能使拥有该指令集的CPU发挥出更好的性能,减少大量的编码时间。

在已往主频为上的年代,人们的心目中都可能会认为,更高频的处理器,在视频转压方面会占据更多的优势,但是当K8架构低流水、高执行效率的出现,终于给Intel狠狠的上了一课。正所谓有竞争才有进步,Athlon64 FX-60的出现,迫使Intel拿出看家本领——Core。基于Core架构的桌面处理器Conroe,完全摒弃了攀登高频的思维,更为着重在核心架构上的革新,以及效率与功耗的比率。
从上述的TMPGENc的视频转压测试中,我们可以清晰的看到,Core架构给我们带来的惊喜,SmartCache共享缓存的概念,配合2/4兆的超大容量的二级缓存,有效的提升了指令的命中率,更进一步提升系统性能。
对比测试-CPU理论性测试
Super PI
SuperPI是由东京大学Kanada Lab.所制作的一款通过计算圆周率的来检测处理器性能的工具,在测试里面可以有效的反映包括CPU在内的运算性能。在玩家群中,Super PI更是一个衡量CPU性能的标尺之一。

当然,就如我们文章前面介绍的,Core架构相对于上一代的NetBurst架构,改进实在太多。整点与浮点执行单元部分、分支预测单元的改进,指令融合技术等等的配合,使Conroe处理器变得史无前例的强大,在深入民心的Super Pi测试当中,Athlon64 FX-60在Conroe的面前,显得相当渺小,目送Conroe E6300以默认的频率突破30秒的大关。
CineBench
MAXON推出的及3D、CPU效能一体的中和测试软件CINEBENCH 2003,它采用了3D设计软件CINEMA 4D的3D引擎,可以用来测试显示卡、处理器的效能。

在同时支持CPU单线程和多线程支持的 CineBench 2003渲染测试中,结果也与我们的预料相一致。细心的朋友可能会发现,Conroe E6400处理器的成绩没有预料的来得理想,这很有可能与测试所用的主板有一定的关系,因为E6400采用的是内置显示核心946GZ,而E6300则采用国内首款支持Conroe的975x主板。由于946GZ尚属工程样板阶段,BIOS方面尚待完善,成绩难免会有所影响,相信随着Conroe的正式发布,我们同样会为大家送上正式零售版的详尽测试。
CPUMark 99
CPUMark99是大名鼎鼎的ZDLabs实验室的一个测试软件,已经问世多年,这个测试软件使用了32位的测试指令,可以有效对CPU的32位性能做出一个快速评价,对Windows XP下的性能有一定的参考意义。

在不支持多线程处理的CPUMark 99中,两款Conroe处理器表现平平,均无法突破300的关口,老当益壮的Athlon64 FX-60,以接近40分的优势甩开Conroe E6400。
WinRAR
WinRAR作为一款目前非常流行的压缩软件,我们使用了它内置的测试功能。测试的结果可以有效的反映CPU的性能。

由于测试Conroe E6300期间,WinRAR尚未推出具备多线程处理能力的版本,因此,对于后来的Conroe E6400处理器,我们也只能采用仅支持单线程处理的WinRAR版本。
SiSoft Sandra 2005
SiSoftware永远是处在技术领域的最前沿,是在像多核心,Wireless MMX,AMD64/EM64T,IA64,NUMA,SMT(Hyper-Threading),SMP(多线程),SSE2,SSE,3DNow! Enhanced,3DNow!,Enhanced MMX和MMX这些新技术出现时最早提供基准测试的软件商之一。Sandra是一个非常有现实意义的合成基准测试,它放弃了使用含义模糊的指数,改为采用有实际意义的性能数字,例如像每秒执行指令数或每秒字节数等。新版本的SiSoft Sandra 2005还针对性的推出了32位和64位版本,两个版本完全整合在一个安装程序中。


SiSoft Sandra 2005中的CPU理论性能测试和多媒体性能测试,主要着重CPU的理论性能值,站在用户的角度来讲,只具备一定的参考价值,实际意义不是很大。

在SiSoftware中的内存带宽测试中,虽然Conroe E6300、E6400分别运行在DDR2-667以及DDR2-800的频率上,但由于主频较低,因此在内存带宽上无法与2.6GHz的Athlon64 FX-60相抗衡。
Everest Memory
Everest作为一个系统检测软件,其前身是Aida32,它可以详细的显示出PC每一个方面的信息。支持上千种(3400+)主板,支持上百种(360+)显卡,支持对各式各样的处理器的侦测。软件自带的Memory Latency测试,可以通过对内存延时的测试,直观显示出内存子系统的效能。


类似的,在Everest中的内存读取写入测试中,由于受主板BIOS的影响,Conroe E6400处理器的成绩并不是十分的理想,不过根据已往的经验,在内存延时方面,Conroe处理器还是有了较大的改进,当然,与内置DDR I内存控制器的Athlon64 FX-60相比,还是具有一定的差距。
不过话有说回来,内存控制器的整合,在游戏中又能为它带来多大的好处,Conroe架构上的进步,能否扭转AMD Athlon64 FX游戏处理器的观念,成为玩家们的新宠?请继续关注下面的3D游戏测试项目。
对比测试-3D理论性能测试
3DMARK 2001SE
通过结合DirectX8支持与全新的显卡,3DMark2001 SE继续提供良好的全面系统基准测试。3DMark2001 SE是在与主要的3D加速器和处理器厂商的合作中创作的,提供了一套可靠的诊断工具。该套件通过使用现实的游戏技术测试系统的真实能力来表现3D游戏性能。测试包括:DirectX8 Vertex Shader,Pixel Shader和Point Sprite,DOT3及Environment Mapped Bump Mapping,对全屏反锯齿和纹理压缩的支持,还有两个使用Ipion实时模型的游戏测试。在目前显卡发展日益迅猛的时候,相比后续的3DMARK03与3DMARK05,3DMark 2001SE的测试结果可以更有效的反映CPU对整体性能之间的影响。

3DMARK03
3DMark03是Futuremark在03年推出的3D测试软件,其包括了四个游戏测试(飞行模拟、FPS、RPG和自然测试)。测试的对象函括了CPU、特性、画质和声音测试。相比于3DMARK 2001SE,3DMARK03的测试更偏重于显卡整体性能的评估,对CPU性能的依赖性非常的小。此外3DMark03还支持3DNow!、MMX、SSE与SSE2指令。

3DMark05
3DMark05是流行的3DMark系列中的最新版本,引入了世界上第一个需要Pixel Shader 2.0以上支持的基准测试!这个精确的性能和图像品质诊断新工具是为DirectX 9.0c设计的,其中包括了常用的3个全新的游戏测试与2个CPU测试,为用户提供了进行可靠硬件评估所需的所有信息。以一个完全利用最新DX9.0渲染的私有图形着色引擎为基础,它对来年的游戏有多复杂提供了一个良好的参考。

在以上三款测试3D游戏理论性能为主的3DMark中,Conroe E6400与Athlon64 FX-60的性能表现按梯队入列。测试过程中,我们发现Conroe E6400的表现更为出色,尤其在经典的3DMark2001中,仅以2.16GHz的时钟频率,就轻松的带领着7800GT,突破3万大关,这是一直以来在人们心目中有着游戏处理器称号的FX-60所不能达到的。
3DMark06
在3DMark05中,FutureMark使用了LiSPSM (Light Space Perspective Shadow Maps)来处理动态阴影,新一代3DMark06中加入了眩目的HDR特效、CSM动态阴影等等,画面更逼真细腻,光影效果更为炫目。
3DMark06的标准测试包括两个HDR测试两个SM3.0图形测试。很明显FutureMark想表达的意思是,未来PC系统的游戏性能最关健的是显卡的HDR/SM3.0效能。3Dmark06还首次使用了AGEIA公司的PhysX物理引擎,用CPU模拟物理引擎计算,这是3Dmark06的一个闪亮的特色。CPU测试的成绩被强制加入到总分里面去,Futuremark揭示了未来游戏发展的方向,CPU/GPU应该获得更好的平衡。
3Dmark06的几个场景令人印象深刻,原深居峡谷的白龙变得幻彩夺目,特别是在阳光的照射下更显状观,鳞片细节和颜色变化莫测,水波纹更加细腻真实。此外“极地深寒”场景是全新开发的Game Test,我们可在寒冷的极地中看到一天日出日落情景,随着太阳在空中慢慢滑过,物体阴影的会随太阳移动而变化。“极地深寒”场影同样使用了FutureMark非常自豪的CSM技术。

在整个3DMark2006的总分上,三款处理器的表现得较为接近,然而,在对未来具有指导性意义的CPU Test项目中,Athlon64 FX-60当仁不让的领先了其他两位参赛选手。
对比测试-热门3D游戏性能测试
HalfLife 2
Half Life 2是今天的游戏技术先头部队的另一半,与Doom 3并驾齐驱。虽然它可能不像它的对手那样阴沉和渲染得夸张,但它的渲染技术是令人敬畏的,就像它出众的设计和完全和谐的物理引擎一样。

DOOM3
OpenGL的巨作DOOM III,Doom III引擎惊人的逼真度基本上依靠两个特性:一个现实的物理引擎和一个统一的照明方案,后者整合了详细的凹凸映射和测定体积的阴影。

Farcry
Far Cry采用了稍微旧一点的图形引擎,但它仍然能够在屏幕各处产生数量惊人的多边形和渲染。CryEngine的代码基础已经较过去两年有了大规模的修正,以充分利用所有最新的GFX和CPU特性。

在这三款老牌的3D游戏的TimeDemo测试中,Core架构的强大再次呈现在我们的面前,让对手也体验了一番狂风扫落叶的感觉。K8的整合型内存控制器、2.6GHz的“超高”频率优势,在Conroe的面前找不到丝毫的优势。
对比测试-新近3D游戏性能测试
F.E.A.R
F.E.A.R.全称为First Encounter Assault and Reconnaissance(初次遭遇战攻击与侦察)。玩家扮演一个精英军事小队的成员,负责解决超自然灵异现象。可以说是军事战术版的X档案。
F.E.A.R.游戏,全屏抗锯、纵深场景的细致刻画、真实的物理效果、实时光影效果都表现完美,支持DirectX9.0接口,尤其是游戏开场时从黑鹰直升机向下看,城市建筑和河流的画面给人极其深刻的印象。物理引擎方面,《F.E.A.R.》使用的是业界使用频率最高的Havok引擎,这款引擎目前被广泛用于FPS游戏。

在F.E.A.R自带的游戏检测项目中,三款处理器的平均游戏和最高帧数都相当的接近,在104、234帧附近,虽然如此,但游戏的最低帧数表现上,我们还是能看到三者之间的差异,Conroe E6400与E6300之间有着7帧的差距,主要归功于4M的超大二级缓存容量以及处理器的时钟频率上。当然Athlon64 FX-60也有相当不俗的表现。
Serious Sam 2 (英雄萨姆2)
Serious Sam 2性能很大部分取决于CPU,但同时它更加依赖显示卡的效能,新版本针对SLI/CF多卡并行输出作了优化,可以通过该软件来窥探系统使用双卡并联输出的效能提升。

在Serious Sam 2的游戏测试项目,显卡终于成为了影响系统性能提升的瓶颈,无法给我们展示这三款处理器的实际性能差异,在后来的X1900XTX测试中,我们也验证了这一点。
Quake 4 (雷神之锤4)
这是一款经典的多人对战FPS类游戏的最新版本,它对系统的要求非常苛刻,对双核处理器作了相关优化,在使用了最新图形、物理引擎后在硬件性能的依赖性提高很多,通过该游戏可以验证出本系统的实际图形表现。

来到支持多线程处理的Quake 4测试,三款处理器按照梯队入列,Conroe E6400处理器也最终迎来了3D游戏项目的全面胜利。
Conroe 激战 2.8GHz FX-60
如果大家觉得还不够看的话,我们不如来点刺激的,首先将Athlon64 FX-60的倍频提升到14x,此时的时钟频率为2.8GHz,接着把倍频降到7x,而外频保持与Conroe E6300相一致,同为266MHz,同时把显卡换成更为强大的ATi Radeon X1900XTX。
|
Conroe 激战 FX-60超频 |
|
测试项目 1024*768 |
X1900XTX |
|
|
FX-60 (200x14) |
FX-60 (266x7) |
Conroe E6300 (266x7) |
|
3DMARK01 |
36487 |
34771 |
26646 |
30043 |
|
3DMARK03
|
20068 |
19307 |
17852 |
18688 |
|
3DMARK05 |
11533 |
11968 |
9955 |
10660 |
|
Half Life 2 |
184 |
167 |
122 |
146 |
|
Doom3 |
164 |
128 |
95 |
148 |
|
FarCry |
167 |
139 |
116 |
138 |
|
Serious Sam 2 |
146 |
139 |
110 |
122 |
|
Quake 4 |
144 |
147 |
113 |
129 |
结果相信也不用我们再次罗嗦,大家就当是饭后的茶点,慢慢的“品尝”吧!
多任务性能测试
模拟日常多任务的应用
|
多任务模拟对比性能测试 |
|
测试项目 |
Conroe E6400 |
Conroe E6300 |
|
|
WinRAR + Super PI 800万位 |
484KB每秒/303.281秒 |
423KB每秒/358.797秒 |
541KB每秒/368.204秒 |
|
2 x WinRAR + Super PI 800万位 |
300KB每秒/306KB每秒/410.562秒 |
239KB每秒/352KB每秒/621.093秒 |
321KB每秒/448KB每秒/611.547秒 |
在上述的多任务的模拟性能测试中,Conroe E6400和Athlon64 FX-60都各有所长,这可能是受独立二级缓存和共享二级缓存的设计所影响。
模拟游戏进行时的多任务测试
Conroe E6400 VS FX-60
|
多任务模拟对比性能测试 |
|
测试项目 1024*768 |
Conroe E6400 |
|
|
单游戏任务 |
游戏 + WinRAR后台压缩 |
性能降幅 |
单游戏任务 |
游戏 + WinRAR后台压缩 |
性能降幅 |
|
3DMARK01 |
32780 |
25869 |
21.08% |
29865 |
26071 |
12.7% |
|
3DMARK03 |
17273 |
15923 |
7.82% |
16165 |
15517 |
4% |
|
3DMARK05 |
7631 |
7233 |
5.22% |
7494 |
7014 |
6.41% |
|
Half Life 2 |
166 |
119 |
28.31% |
153 |
127 |
17% |
|
Doom3 |
168 |
127 |
24.4% |
123 |
101 |
17.88% |
|
FarCry |
160 |
120 |
25% |
142 |
113 |
20.42% |
|
Serious Sam 2 |
96.1 |
60.5 |
37.04% |
96 |
38.1 |
60.31% |
|
Quake 4 |
176 |
123 |
30.11% |
166 |
104 |
37.35% |
针对不同类型的游戏项目,两款处理器的成绩下降幅度也各有不同,但从整体上来讲,开启WinRAR做后台压缩的Conroe E6400,游戏方面依然比Athlon64 FX-60来得流畅。
Conroe E6400 VS Conroe E6300
|
多任务模拟对比性能测试 |
|
测试项目 1024*768 |
Conroe E6400 |
|
|
单游戏任务 |
游戏 + WinRAR后台压缩 |
性能降幅 |
单游戏任务 |
游戏 + WinRAR后台压缩 |
性能降幅 |
|
3DMARK01 |
32780 |
25869 |
21.08% |
28171 |
21787 |
22.66% |
|
3DMARK03 |
17273 |
15923 |
7.82% |
16400 |
15209 |
7.26% |
|
3DMARK05 |
7631 |
7233 |
5.22% |
7528 |
6611 |
12.18% |
|
Half Life 2 |
166 |
119 |
28.31% |
134 |
96 |
28.36% |
|
Doom3 |
168 |
127 |
24.4% |
150 |
106 |
29.33% |
|
FarCry |
160 |
120 |
25% |
137 |
100 |
27% |
|
Serious Sam 2 |
96.1 |
60.5 |
37.04% |
95.3 |
60 |
37.04% |
|
Quake 4 |
176 |
123 |
30.11% |
149 |
109 |
26.84% |
较为有趣的是,虽然两款Conroe处理器的二级缓存容量不相一致,但是,在进行上述的多任务模拟中,开启WinRAR后,各个游戏的帧数下降幅度都惊人的类似。
Conroe E6300处理器功耗测试
系统待机时,整机功耗如下图:

CPU + GPU全速时(NV 7800GT),系统整机功耗如下图:


我们可以看到,得益于65nm的制造工艺,以及低流水线级等核心架构的革新,Conroe处理器的整体功耗有了较大的下降,相信大家都不会忘记我们年前做的65nm赛扬D 处理器的功耗测试,详细可以点击这里《谎言破灭!Intel 65nm赛扬真实功耗测试》,那时的65nm赛扬D,系统全速时的功耗竟高达200~215W,实在令人汗颜!如今Conroe处理器在功耗上的改进,让我们真切的感受到Intel Pentium III时代的再次回归。

测试过程中,我们分别采用了TT的Sonic Tower以及AMD的K8原装散热器,来尝试Conroe处理器对被动散热的适应能力。在室温20°的环境下,相当顺利的通过了长达两个小时的双SP2004的残酷烧机测试。
测试总结与分析
基于Core架构的Conroe处理器,其性能之强大,大家有目共睹。但如果产品上市的架构未能切合大众消费水平的话,所有的性能指标只能是一串数字,就类似于称霸双核领域多时的Athlon64 FX-60处理器,国内外又有多少朋友能真正的拥有?相反的,Intel在入门级市场上所投放的Pentium D 805 双核处理器,却让许多朋友第一次的亲身体验了双核系统所带来的快感。
因此,站在消费者的立场,他们更为关心Cornoe处理器上市时的零售报价情况,下面是来自消息人士的透露,部分Conroe处理器上市价格的曝光图。
|
Conroe处理器型号、售价预览表 |
|
产品型号 |
处理器频率 |
前端总线频率 |
二级缓存 |
预计售价 |
| Conroe EE |
3.33GHz |
1333MHz |
4MB |
- |
| Conroe E6800 |
2.93GHz |
1066MHz |
4MB |
- |
| Conroe E6700 |
2.67GHz |
1066MHz |
4MB |
530美元 |
| Conroe E6600 |
2.4GHz |
1066MHz |
4MB |
316美元 |
| Conroe E6400 |
2.13GHz |
1066MHz |
4MB |
244美元 |
| Conroe E6300 |
1.86GHz |
1066MHz |
2MB |
209美元 |
| Conroe E4200 |
1.6GHz |
800MHz |
2MB |
- |
值得大家注意的是,Conroe处理器中只有E4200是200MHz外频,其他的均为266MHz外频!(而作为新一代旗舰的Conroe EE处理器,外频则是史无前例的333MHz)
通过上述的表格,我们可以了解到,得益于65nm的制造工艺的提升,使产品的制造成本得到进一步的降低,Conroe处理器的上市价格可谓是相当的吸引,以Conroe E6300为例,209美元的预计售价,折合成人民币也就在16xx~17xx之间,人们就能拥有相当于Athlon64 FX-60处理器的90%性能,性价比突显。
当然,我们还看到了Conroe E4200处理器的身影,较低的处理器外频和前端总线,能否帮助他成为新一代的“Pentium D 805”,相信时间会证明一切。可能你会埋怨无尽头的等待给你带来的精神上的困扰,但是,我们可以悄悄的告诉你,Intel很有可能会提前发布Cornoe处理器,并在全球范围内同时上市,发布时间可能会在浓烈夏天气息的7月,5月已经过去了一个多星期,7月还会远吗?