胶水双核-EDA365

胶水双核

　　胶水双核
　　目录
　　1称呼由来
　　2“胶水”处理器的发展
　　3客观评价
　　4AMD与Intel之间的真假双核之争
　　5拨开浮云见月明详解手机双核处理器
　　·参赛选手亮相
　　·较量项目一：处理器核心架构
　　·较量项目二：处理器核心的协同作战能力
　　1称呼由来
　　“真双核”与“假双核”的说法是由AMD提出来的，Intel将两颗Pentium 4核心封装在一个基板上，组成了Pentium D，AMD认为这种架构是假双核，而网友则更具想象力，将这种双核称为“胶水”双核。“真四核”与“假四核”也是同样的道理，Intel将两颗Core 2 Duo粘合成为一颗Core 2 Quad，而AMD则重新设计了Phenom原生四核CPU，“原生”与“胶水”的论战再起波澜。
　　所谓“胶水”处理器并不是粘在一起，而是使用特殊方法将两个或更多芯片封装在一起制造的处理器。由于这种特殊方法像是将两个或更多核心用胶水粘在一起，由此而得名。
　　纵观处理器发展的一路走来，胶水处理器的作用还是不可磨灭的，它让处理器的性能再次提升，当AMD指责Intel的产品是假内核，而Intel则辩称用户只重视CPU性能而并不在乎CPU内部架构。虽然AMD在“真假双核”之争中获利更多一些，但人们在经历了“真假双核”的狂轰烂炸之后，选购CPU的时候更冷静和理智了。因为在实际各种评测之中，AMD的“真四核”性能却往往不如英特尔的“胶水黏合”。因此，我们在比较CPU的时候，应该更关注其实际性能，不要盲目听商家搬弄概念。
　　2“胶水”处理器的发展
　　我们去回顾一下处理器的发展史上有哪些产品属于“胶水”处理器的行列：
　　1.最古老的“胶水”处理器
　　发布于1995年的Pentium Pro是首款支持超过4GB内存的处理器，它利用36位物理地址扩展（PAE）技术最大可支持64GB内存。这款CPU也是第一款P6架构（酷睿2核心也源自于此）处理器，也是首次在CPU内部集成L2缓存。
　　Pentium Pro最大特色在于首先采用了双核封装。由于那时CPU的制造工艺还停留在350nm-500nm阶段，高速二级缓存单元还不能像现在这样直接与运算核心加工在同一个晶圆颗粒上面，必须要用两颗晶圆颗粒分别加工，即一颗晶圆加工运算核心，另一颗晶圆加工缓存，然后再将它们“胶合”在一起。其实，这在当时已经是一种非常先进的制造方法了。别忘了，在这之前，运算核心只能和主板上的系统内存交换数据。当二级缓存和运算核心被一起封存装进CPU后，二级缓存就可以与运算核心以相同的频率运行，不必像以前那样和速度较慢的系统内存通信，为数据通信提供了捷径，直接提升了性能。
　　2.引发口水大战的“胶水”处理器：Intel奔腾D双核
　　其实这还是要从AMD X2系列说起：当时在AMD推出X2以后，Intel P4依然无法摆脱高热量、高能耗、低性能，导致Intel瞬间败北。之后Intel为了应急推出了PD双核产品，这款把两个单核处理器粘在一起的产品，显然没有达到预期的效果，面对着AMD X2的“真双核”有备而来，Intel首款胶水双核也是为多核之路充当了回小白鼠，也正是这样才让Intel开始发展自己的“真双核”，不过“胶水”CPU也从那以后成为Intel的最爱。“真假双核”的说法从那时开始应运而生，对立双方各执一词。
　　3.“胶水”处理器再次升级：Intel酷睿2四核
　　2006年对AMD和英特尔来说，双核斗法成了贯穿全年的唯一主题。起初，AMD凭借Athlon 64 X2 和Athlon 64 FX处理器的良好表现横扫千军，在市场中威风八面。不曾想，英特尔靠PD假双核卧薪尝胆之后，铸剑Core 2大获成功，重夺“性能”王座，从此，攻守易帜。
　　2007年年初的时候，Intel发布了全新的Core 2 Quad Q6600四核处理器。作为世界上第一款四核处理器，这款处理器再度被牵涉进了“真假”问题的纷争当中。众所周知，Intel的Pentium D双核处理器，就是将两个Prescott核心集成在一起而成为了第一代双核心的Smithfield处理器。之后Intel的酷睿双核回归到了“真双核”行列里，而到了从双核到四核架构过渡之时，Intel再次故技重施，将两颗Conroe核心集成到一起，成为了Intel第一款四核心Kentsfield处理器。这样的设计虽然简单，并且2+2模式的也可以缩短产品研发周期。不过由于先进的架构和设计的关系，这款“胶水”的性能不错，可能是由于Intel“胶水”配方好，和“胶水”工艺提高了，使得酷睿2四核产品性能十分优秀。
　　4.“胶水”玩上瘾：功耗最低的双核Atom N330
　　伴随着“胶水”CPU一路走来的Intel，虽然在全新架构i7中，重登真四核领域，但是“胶水”的理念却已根深蒂固，这不就在低功耗领域明目张胆的又重操旧业玩起了“胶水”双核。图中就是Intel发布的双核Atom低功耗处理器，型号为Atom 330，该处理器拥有1.6 GHz的主频，采用45nm工艺，拥有2个核心，TDP仅有8W，拥有533 MHz的FSB，1MB二级缓存，售价达到了43美元。
　　3客观评价
　　最后，我们可以感受到，一些国际大厂为何要在最王牌尖端的芯片产品上使用我们俗称的MCM“胶水”技术，其实有时候胶水技术也未必是落后的象征，只是针对的实现目的方法而已：
　　1.实现更高的芯片间传输性能－例如Intel Pentium Pro是为了性能而嵌入L2 Cache，或如Microsoft/ATI Xenos也是为求取性能而内嵌eDRAM，此外IBM大型主机用处理器，以及POWER4/4+/5/5+等，也都是为了性能而使用MCM“胶水”技术，求性能为首要，整合度更提升则为次要。
　　2.更高整合、多核竞赛－Intel为求在双核、多核的推出进度上能够加快，因此三步并两步来加紧追赶，如此不仅使用裸晶层面的多核整合技术，同时也使用封装层面的多核整合技术。
　　3.为求弹性、快速发展－Xenos之所以实行嵌入式eDRAM的原因还有一个，那就是弹性发展、加速发展。由于eDRAM技术并非是ATI的专长，而是NEC的强项，虽然ATI与NEC可以更密切合作，在裸晶层面就将eDRAM与C1一同设计，进而量产，但如此做也有部份问题要顾虑。例如，ATI与NEC必须花费更多的协同合作心力，特别是在实体电路的设计层面，且在更换实体电路制程时，双方就必须再次对实体电路的设计进行再协同沟通与再设计。再者，除了设计协同与电路改版等沟通心力外，也会羁绊双方在原先自有领域的发展进度，使原有自己擅长的本务进步动力减缓，反而使其他同业有机会追赶。
　　所以，还是以各自分开设计与分开发展为宜，最后再运用MCM封装方式来加速互连，以获得比PCB电路板层次更高的性能，但又有Die裸晶层次所不具备的发展、设计弹性。如此很明显的：MCM将是整合度、互连性能高于板卡层，但电路发展与设计弹性又高于裸晶层的一种技术，相信未来此种技术的应用将愈来愈广泛。
　　4AMD与Intel之间的真假双核之争
　　2005年中，Intel和AMD相继发布双核心处理器Pentium D和Athlon64 X2，双方的产品是各有特色：AMD继续保持单核Athlon64系列高效能低功耗的优势，而Intel继续保持Pentium4系列高频率高功耗的特色。
　　当然最大的不同还是在核心架构方面，Athlon64 X2是经过重新设计的单一芯片原生双核方案，而Pentium D则是两把两颗Pentium 4核心封装在一起而已。Intel的高频低能与胶水双核的确是一大软肋，于是AMD最先发难，挑起了真假双核之争，下面我们就来简单回顾下：
　　2005年5月，AMD宣称，其用于服务器和台式机的双核处理器产品为“真双核”架构，以与Intel的Pentium D产品进行区分。
　　2005年6月7日，AMD大中华区市场总监王妩蓉表示：我们非常尊重我们的竞争对手，无意对它进行抵毁，我们只是想说明在双核处理器方面AMD的架构与英特尔的架构并不相同，AMD的产品在架构上的优势更为明显，性能更强。
　　2005年12月上旬，Intel总裁来华公关，称AMD转让给中国的处理器技术过时。
　　2005年12月中旬，AMD发起“我为双核狂AMD真双核体验风暴活动”，再抛“真假双核论”的王牌，认为自己是一个芯片上的两个核，是真正的双核，而Intel是一个处理器上的两个芯片，是假双核，并从网上招募电脑爱好者进行线上体验双核应用。同时在北京举行的小型媒体交流会，展示AMD双核处理器性能优势的大量测试数据。
　　Intel中国公司新闻发言人刘捷对于AMD发起挑战的问题回答很简单：“没必要”。其表示，Intel作为首先提出双核概念并且实现大范围市场化的领先企业，对于自己的产品十分有信心。没有必要通过这种评测来证明。
　　2006年02月27日，Intel中国北方区总经理曾明指出AMD在双核上制造了一个“谎言”。这是Intel半年来第一次针对AMD双核挑战表明立场。同时，曾明还拿出一家第三方最新的评测数据，称AMD双核产品在执行多任务时的低性能。
　　2006年2月28日，AMD公司就Intel的系列指责做出回应，表示“此测试结果的出现纯属软件原因，AMD无意攻击竞争对手。Intel公司引用的数据是断章取义。” 并表示从未对Intel的处理器称假双核，更没有对Intel进行过抨击，所谓“假双核”的说法属于空穴来风。
　　自从双核处理器问世以来，AMD曾在美国、新加坡等地邀请英特尔“决战双核”，对此Intel一直不予理会，Intel唯一一次公开回应，使得延续一年多的“真假双核处理器”之争愈演愈烈。
　　资深的玩家应该知道，AMD在当年的确占有性能和功耗方面的双重优势，所以AMD理直气壮、咄咄逼人的态势让Intel无言以对。但当年Athlon64 X2的价格可是高得离谱，最便宜的型号都要2000左右，而Intel则非常亲民，Pentium D 805还不足千元，处于劣势的Intel担任了双核普及使者。
　　5拨开浮云见月明详解手机双核处理器
　　参赛选手亮相
　　首先，让我们来看看市面上有哪些双核心手机处理器。德州OMAP4430，三星Exynos 4210，英伟达Tegra 2，高通MSM8x60。
　　好，这些就是即将上阵的选手了。下面我们会依次考量它们在诸多方面的表现，看看究竟哪个双核名副其实，哪个双核浪得虚名。
　　较量项目一：处理器核心架构
　　我们知道，计算机程序，都是由一条一条的指令组成的。这些指令有很多种功能，有的是把数据从一个地方复制到另一个地方，有的是做数学运算，有的负责判断某一个条件，有的负责从一处跳转到另一处。编译器会把所程序员写出的程序编译成一条一条顺序的指令，就像电器的使用指南一样，让处理器遵照它去做。为了方便理解，我们假设一个程序的内容是做一份考试卷，执行的过程是先做完选择题，再做完问答题；做选择题的条件是要有铅笔去涂答题卡，而做问答题的条件则是要有钢笔去写答题纸。
　　如果你忘了带铅笔，那么为了完成考卷，就必须要等到邻座的做完了选择题，你找他借来铅笔，才能继续自己的考卷，这样就耽误了时间。对于一颗标准处理器而言，很多时候都会遇到这类“没有带铅笔”的情况，比如需要访问的数据在内存里，这就需要处理器通知内存管理器，让内存管理器去把数据调入处理器，才能继续执行这一条指令。由于处理器内部的时钟延迟是纳秒级别，而内存的运行频率则有数十纳秒的延迟，两者之间差了许多倍，因此处理器一般需要消耗很长的等待时间，才能继续开始工作，最终的结果就是性能下降。
　　最后，我们给这些处理器的核心架构作个评分（考虑到默认频率）：
　　Tegra 2 ★★★
　　OMAP4430 ★★★★★
　　MSM8x60 ★★
　　Exynos 4210 ★★★★★
　　较量项目二：处理器核心的协同作战能力
　　可能多处理器架构这个词对于不少读者而言都是很陌生的，很多人可能从来都没注意到过这方面的东西。所谓多处理器架构，就是说多颗处理器以何种模式共同运行，以怎样的方式合作执行程序。在PC领域，这个概念并不重要，因为大家看到的多处理器（多核心处理器也可以看作制作在一个芯片上的多处理器），在逻辑架构上都是一样的，那就是同步多处理器，英文为Synchronous Multi-Processors，缩写为SMP（不是对称多处理器的那个SMP）。但是在多处理器体系刚刚出现的阶段，曾经也有过很多不同的逻辑架构，而在目前的手机市场上就恰恰存在着不采用SMP架构的多处理器，那就是高通的MSM8x60。
　　与SMP不同，高通所采用的架构名为ASMP，即异步多处理器架构。所谓同步和异步，差距并不是简单的两个字，在具体实现上的区别非常大。但是在此我们并不需要了解它们之间学术上的区别，我们只从最粗略的角度来看
　　所谓同步多处理器，顾名思义就是同步的，即多枚处理器运行在同样的时钟频率，共享同样的缓存数据，协同工作。简单来说，同步多处理器系统在工作的时候，每当一个任务完成后，空闲的处理器会立刻寻找下一个新的任务，对于外部而言，这两颗处理器是一个整体，共同完成同一个工作。
　　而异步多处理器则更接近于若干个独立工作的处理器，它们之间可以运行在不同的频率下，每个处理器维护自己私有的缓存数据，最重要的是，它们之间会利用一种仲裁机制，以轮流工作的方式执行任务。它们更像是一些互不干扰的独立处理器，各自完成各自的事情，轮流执行不同的工作。
　　看到这儿，相信大家也看出来了，同步和异步最大的区别就在于轮流工作这四个字。具体而言，就是在同一时间，只有一颗处理器可以接受任务，另一颗不论是否繁忙，都不能接受新任务。可能光靠文字说明还不是那么生动，下面我们就来看几张图，了解一下相对于同步多处理器“谁空闲谁接单“的工作模式而言，这种轮流工作到底是怎样进行的，又会导致怎样的结果。
　　图中每一横行代表一个时钟周期，我们用红色的方块代表正在读取任务，绿色的方块代表正在执行任务，方块中的数字代表不同的任务，而空白代表着空闲状态。在第一张图里，我们假设任何任务只需要一个周期就可以执行完毕。一下这两种架构的工作方式。
　　同样，让我们也来针对多处理器架构，给四款双核一个评分：
　　Tegra 2 ★★★
　　OMAP4430 ★★★★★
　　MSM8x60 ★★★
　　Exynos 4210 ★★★★★
　　较量项目三：通讯总线
　　关于总线的研究就到此为止了，依然按照惯例，最后给一个分数：
　　Tegra 2 ★
　　OMAP4430 ★★★★★
　　MSM8x60 ★★
　　Exynos 4210 ★★★★★
　　较量项目四：多媒体
　　何谓多媒体扩展指令集？由于原理复杂坚涩，小编就简单的打个比方：厂商们分析平时处理器干哪些事情最慢、又最经常用到，然后把这些最消耗时间的事情固化成电路，做成一个额外的部分，和处理器集成到一起。使用的时候，只通过一条指令，就能够访问和计算多组数据，把最消耗时间的事情尽快做完。在计算机词汇里，这种指令集叫做SIMD（Single Instruction Multiple Data，单指令多数据）指令集。在视频解码方面，Tegra 2也会因为不具备NEON协处理器而受到很大的影响。因为我们知道，Tegra 2虽然号称可以支持诸多格式的1080p全高清解码，但是它对视频的编码格式有着非常严格的要求，例如Tegra 2的视频解码核心只能硬件解码Main Profile的H.264视频，而对于其它的就只能靠处理器来进行软件解压。这时没有NEON协处理器的帮助，视频解压就很难高效的进行，最终导致Tegra 2的多媒体特性缩水。
　　也许nVIDIA是认为NEON协处理器的授权价格过于昂贵，或者可能因为规模太大而提升制造成本，而最终选择了放弃，但作为消费者而言，不具备NEON指令集的Tegra 2无疑会在多媒体方面的竞争中被对手远远甩开。好了，关于多媒体的比拼也要告一段落了，最后我们照例为每个处理器给出评分。
　　Tegra 2 ★
　　OMAP4430 ★★★★★
　　MSM8x60 ★★★★★
　　Exynos 4210 ★★★★★
　　较量项目五：3D加速
　　而作为曾经参与桌面竞争、当下专注嵌入式GPU的Imagination公司，自然不愿意让出嵌入式独立GPU市场的性能领导地位。在OMAP4430上，我们看到的就是这家公司设计的PowerVR SGX540。这是一颗大家很熟悉的GPU，因为早在单核Cortex A8时代，三星就在代号蜂鸟的处理器中采用了这颗GPU，它强大的性能也让采用蜂鸟处理器的机型在单核时代傲视群雄。与GeForce ULP不同的是，PowerVR SGX540内并没有单独的顶点处理器或者像素处理器，而是包含了四组通用处理器。这种类似于桌面显示核心统一渲染器的设计结构可以让PowerVR GPU用最少的硬件获取最大的性能，从而节约成本和功耗。值得一提的是，也正是由于通用处理器的设计，PowerVR SGX540成为了当前唯一一颗支持OpenCL通用运算标准的GPU
　　可以看到，在规格指标方面，Exynos 4210是遥遥领先的，而Tegra 2紧随其后。至于具体的性能表现，我们在后面的测试中将简单介绍。值得注意的是，上表中的参数未必是最终的实际性能，理论参数一般都会受到实际应用环境的强烈影响。
　　不过不管怎样，我们还是要打个分的，暂时按照物理参数吧。
　　Tegra 2 ★★★★
　　OMAP4430 ★★★
　　MSM8x60 ★★
　　Exynos 4210 ★★★★★
　　谁是纯爷们？四款双核大混战
　　上述评测，也许很多人会觉得，为什么Tegra 2如此之差？ nVIDIA果然还是这方面的菜鸟啊！如果这样想你就错了，因为在这些芯片的背后，还有一些重要的参数和取舍，之前的文章里我们并没有提到，那就是成本上述炫目的技术分析，相信大家都累了。下面就让我们从一些性能测试中一窥这几颗处理器在实际产品中的表现吧。首先介绍一下采用了这四颗芯片的实际产品。
　　Exynos 4210与Apple A5则走在了性能的极端，实际上可以说忽略了成本与功耗的表现。而最悲剧的依然是Tegra 2，nVIDIA片面追求低成本，导致性能方面惨不忍睹，这可能是nVIDIA在Tegra 2上需要学到的最大的教训。
　　它们也很重要：功耗和成本它们也很重要：功耗和成本它们也很重要：功耗和成本它们也很重要：功耗和成本