频道直达:新闻 - 组网 - 安全 - 服务器 - 存储 - 系统 - 应用 - 开发 - 数据库 - 前沿 - 技术人 - 培训 - 求职 - 读书 - 教程 - 专题 - 产品 - 案例 - 技术圈 - 博客 - BBS
51CTO.COM_中国领先的IT技术网站
找资料:

四核服务器处理器Barcelona的架构简介

作者: Tianji 出处:天极网 2007-03-09 15:20    砖    好    评论   进入论坛
阅读提示:Barcelona是AMD首款四核心处理器,采用65nm制造工艺,和Intel的四核Kentsfield处理器由两个双核心组成的架构不同,Barcelona是单处理器集成四个核心的架构是真正的原生四核处理器。不过,尽管在技术上要优于Intel的Kentsfield,我们还是不确信Barcelona在现实中的性能会大幅超越Kentsfield。
在过去的几年中,Intel的处理器发展规划路线并不固定。为了延续P6架构核心的成功,Intel采用了两个开发团队并进的策略,其中一个团队继续发展 Pentium 4采用的NetBurst架构,另一个团队将对代号Banias的Pentium M进行重新设计,目标是更低成本、更低功耗的高集成度核心。最终的结果是NetBurst架构的发展被Banias的进化超越。Dothan是Banias第一个进化成果,它拥有更高的时钟频率和更多的缓存,为进一步的发展奠定了基础。随后Intel的以色列发展中心(IDC)以Dothan为基础提出了原生双核心和共享二级缓存解决方案,这就是代号Yonah的Core Duo处理器,也是首款双核心Intel处理器。从Dothan到Yonah的演进具有远比Banias到Dothan更重大的意义,不仅仅只因为 Yonah是首款Intel双核心处理器,最重要的是Yonah拥有更多架构上的改进。接下来Intel又对Yonah进行了改进,这就是让Intel从竞争对手AMD手中夺回技术领先地位的Core 2系列处理器。
和对手Intel相比,AMD近几年的发展策略显得相对保守,自从K7核心在技术上领先于Intel之后,角色发生了巨大的转变,他们从先前的追赶者变成了领先者,突然的角色互换使他们失去了发展的动力,加之他们没有足够的财力可以像Intel那样同时进行两个处理器开发计划。他们最终选择了继续K7核心的开发,而没有采用重新研发新架构的高风险计划。由K7进化而来的K8进行了轻微的架构改进并且整合了北桥芯片,可以说K7到K8的进步非常大。但是不得不承认Intel从Dothan到Yonah的递进做的更为出色。而造成Intel追上AMD的更为重要的原因是,Intel的NetBurst架构开发团队以每五年为一个微架构更新周期,另一个Pentium M开发团队在IDC的微架构更新周期竟然达到了每年一次,从Banias、Dothan、Yonah到 Merom/Conroe仅仅只用了四年时间。而在这期间K8几乎没有任何发展。如果Intel仍然继续NetBurst架构向下发展,以五年为一个微架构更新周期,或许AMD的K8仍然在保持领先地位。最终的结果证明,Intel采取双线并进的研发计划是非常明智的选择,成为了决胜的关键。
幸运的是AMD提早认识到要与Intel竞争必须缩短研发周期,他们把原先4-5年一个微架构更新周期缩短到了两年,这也造就了Barcelona计划。尽管Barcelona架构比Core 2 Duo迟了一年左右,但是它仍然被AMD寄予厚望,担当起重新夺回技术领先地位的重任。Intel过渡到45nm制造工艺计划是Barcelona的最好机会。按照目前的消息来看,Intel采用45nm制造工艺的代号Penryn的Core 2 Duo处理器将会在2007年底上市,但是从目前的情况来看全面上市至少要到2008年。也就是说,Intel过渡到采用45nm制造工艺的Penryn 可能需要比预期更长的时间,而采用Barcelona架构的服务器版本将会在2007年中上市,桌面处理器也会在第三季度上市这可能会使AMD在时间上抢得先机。
认识Barcelona架构
Barcelona是AMD首款四核心处理器,采用65nm制造工艺,和Intel的四核Kentsfield处理器由两个双核心组成的架构不同,Barcelona是单处理器集成四个核心的架构是真正的原生四核处理器。不过,尽管在技术上要优于Intel的Kentsfield,我们还是不确信Barcelona在现实中的性能会大幅超越Kentsfield。
Barcelona的设计比K8要复杂的多,需要多达11个金属层,而K8和Core 2 Duo分别只有9个和8个。而更多的金属层只会使制造过程更为复杂增加成本,对于最终的用户来说并没有太大意义。Barcelona拥有463百万个晶体管,比Kentsfield少了119百万个。晶体管数量少是因为缓存减少的原因,Barcelona上的每个核心都拥有128KB一级缓存和512MB 二级缓存,再加上四个核心共享的2MB三级缓存,缓存的总量为4.5MB。而Kentsfield的缓存总量达到了8.25MB,比Barcelona多了80%。不过Barcelona的缓存仍然远远要比四核心K8要多,如果不计算缓存晶体管,一个双核Athlon 64 X2处理器的晶体管数量大约为94百万个,而Barcelona的晶体管数量大约为247百万个。即使两个双核Athlon 64 X2处理器的晶体管数量也没有Barcelona多。

SSE128:
在从K8到Barcelona的众多改进中有一个非常重要的改变,AMD把它称为SSE128。在K8架构中可以同时执行两个SSE指令,但是SSE的执行带宽仅仅只有64-bit。在K8中执行一个128-bit的SSE指令,必须要分成两个64-bit指令来执行。这意味着执行一个128-bit的 SSE指令需要占用一个额外的解码通道。Barcelona把K8的64-bit SSE的执行带宽提高到了128-bit,因此执行一个128-bit的SSE指令不用再进行分解。这样一来不但可以获得更多可用的解码带宽,而且指令的执行效率也大大提高。增加SSE指令的执行带宽也会造成核心内部的很多改变。由于获得了更多的解码带宽,在执行128-bit的SSE指令时有出现了一个新的瓶颈,那就是指令取得带宽。Barcelona的指令取得带宽已经从K8的每周期16byte提高到了32byte。32byte的指令取得带宽不仅仅有益于SSE编码,对整数编码也同样非常有好处。更大的指令取得带宽会明显推进处理器性能。
在Barcelona上你可以取得和解码更多的指令,这意味着你需要获得更多的数据到执行核心,因此AMD加宽了L1缓存和SSE寄存器之间的传输界面。现在Barcelona可以每周期执行两个来自L1-D缓存的128-bit SSE指令,原理和K8每周期执行两个64-bit指令一样。加上AMD同时加宽了L2缓存可内存控制器之间的传输界面,从而解决了指令取得带宽的瓶颈。事实上SSE128的改进非常类似于Yonah到Merom的改进。在Conroe/Merom之前Yonah的FP/SSE性能还不如K8。这在Yonah和K8的性能对比测试中有很明显的表现,虽然两者在大多数应用程序、3D渲染和游戏性能中的性能表现非常接近,但是在视频编码性能测试中K8明显要优于对手。但是Core 2处理器的出现使这种情况发生了逆转,视频编码性能大幅度超越K8。也许SSE128的改进会使这种情况有所改变。
【责任编辑:城尘 TEL:(010) 68476636-8003】

专题
AMD Phenom三核处理器解析
2008年春季英特尔信息技术峰会(IDF)
VMware技术应用
服务器维护与应用基础
英特尔45纳米Penryn处理器发布
我也说两句

匿名发表

(如果看不清请点击图片进行更换)


中 国 领 先 的 IT 技 术 网 站 ·
技 术 成 就 梦 想
·服务器基础知识入门 (查看30754次)
·龙芯要做中国的“奔腾” (查看22387次)
·刀片服务器基础 (查看22246次)
·2008年IT产业29个预言 (查看21009次)
·AMD Phenom三核处理器解析 (查看19442次)
订阅技术快讯
电子杂志下载
名称:SQL Server数据库管理精品黄皮书
简介:书中文章经过精挑细选,便于用户能根据自己的实际工作和学习,快速在本书寻找到相关资料。内容涵盖了SQL Server的安装与升级、语句查询、数据备份和恢复、自动化任务、数据同步、数据字典、安全和预防、性能和优化、集群等各方面应用信息,以及DBA管理人员在数据库管理工作中
名称:2007路由技术大全
简介:《2007路由技术大全》由51CTO.com网站特别策划制作,该书包括路由器技术、路由器产品、路由器配置、安全设置、路由器故障处理、路由器密码恢复,以及广大网友在实践使用中的心得经验和技巧文章,内容注重实用性,适用于初学者入门,也适合多年从业者提高,是一本实践和理论完
名称:网络安全精品应用黄皮书
简介:《2007精品网络安全黄皮书》包括了9个大类24个小类, 800余篇文章,内容包含了熊猫烧香病毒、DDOS攻击、ARP病等热点问题的介绍及解决方案。从病毒查杀、防范、系统、数据等各方面的安全设置到黑客技术的了解、防范,涉及到了安全应用的全部领域, 由浅至深内容全面。