【PConline 横评】2011年12月22日,AMD正式面向全球发布新一代HD7000系列显卡,率先面市的是单芯旗舰产品:AMD Radeon HD7970,这也是业界第一款28纳米GPU图形芯片、业界第一款DX11.1显卡、业界第一款PCI-E3.0接口显卡。相对于上一代产品,HD7970在架构上有很大的改进、在性能上有巨大的提升,是一款面向未来游戏/高性能运算的前卫新一代显卡。
AMD Radeon HD 7970 图片 评测 论坛 报价
但12月22日对AMD HD7970来说只是一次纸面发布,AMD的公版显卡、AMD各大合作伙伴的产品实物,随后才陆续送达PConline评测室。今天(2012年1月9日)是AMD HD7970显卡的解禁日,现在就让我们来带领大家走近真实的HD7970显卡,来一起揭开这款新一代显卡令人激动的划时代强悍性能和代表业界未来发展方向的诸多新特性!
AMD Radeon HD7970:当前性能最强的单芯显卡
GPU设计之初就是用于对图形进行分块渲染的并行处理器,因此增加芯片内部的渲染单元,是提升GPU性能的捷径,这也仍是当前显卡性能提升的最主要手段。HD7970图形芯片内建了2048个流处理器、采用384bit显存位宽,硬件规格大幅高于上一代旗舰,芯片浮点运算性能也比HD6970大幅提升了40%,因此说HD7970是“当前全宇宙最强的单芯显卡”也并不为过。
本期测试显卡天梯指引位置如下:
在本期测试中,我们采用了显卡天梯图以便更直观地体现出显卡的具体性能以及对比测试显卡之间的性能高低。同时显卡的发展步伐日新月异,不断有新品上市与被淘汰,显卡天梯图也需要不断更新。其中必定有瑕疵之处,我们也真心希望广大网友对显卡天梯图上的不足做出批评指正。
PConline显卡天梯图
PConline显卡产品天梯图说明:凭借近乎1.5倍的强悍硬件规格, HD7970性能大幅超越了AMD上一代旗舰HD6970,实际测试表现也大幅领先N卡旗舰GTX580,仅次于HD6990、GTX590这些“变态”级别的双芯显卡,因此在显卡天梯图上位居顶级显卡之列。>>
[page]
AMD HD7970显卡GCN架构解析(一):
HD7970显卡最受人期待的地方正在于其强大的性能,而性能则源自于强大、高效的核心架构。HD7970显卡的GCN核心架构内建2048个流处理器、43亿个晶体管,是当前规模最大的图形芯片,但显卡核心面积却仅365平方毫米,小于上一代旗舰HD6970,这就是28纳米最先进制程的神奇魅力。借助28nm工艺,HD7970显卡默认运行频率已经逼近1GHz,而且显卡发热量更低。更小的核心面积,还可以在日后成熟量产时降低芯片成本。
HD7970采用的GCN核心架构,是在HD6000系列显卡的核心架构上大幅度优化而来,主要是提改进了核心内运算单元处理指令的灵活性,从而提升了效率。借助28nm工艺,GCN架构还可以达成更高的运行频率,而且发热量更小、芯片面积更小,从而可以提升芯片性能,并在日后成熟量产时降低芯片成本。
HD7970(Tahiti)核心面积比HD6970(Cayman)还小
HD7970的GCN架构,在最底层的流处理器管理模式上经历了大幅的优化重组,内部组织架构更灵活、更高效。在指令运行方式上,GCN也改变了AMD自R600以来一直沿用的VLIW打包吞吐模式,这个改动幅度可以说是对GPU运算模式基础的变更,对AMD GPU架构发展意义重大。VLIW(超长指令字)单线程执行密度很高,有高吞吐低灵活性的特点,但却在多个流处理器并行性上存在一些难以预料的指令打包、分派灵活性逻辑缺陷,在GPU这样规模巨大的并行处理器上,数千个流处理器的整体效率反而受到影响。
GCN驾构:为高性能运算优化
因此,在设计理念上,GCN架构已经不再单纯的追求图形渲染能力,而是更注重于为高性能运算优化,这个理念转变,更符合“通用计算就是图形计算”的今后趋势。GCN架构正是AMD加强通用计算性能思路的表现,而且高性能通用计算也能同时带来更高的图形性能。放弃VLIW不仅意味着GPU大规模并行框架内普通SIMD指令模式的回归,更标志着AMD理念转向GPU高性能计算。
HD7970的2048个流处理器被划分成了32个"GCN"并行执行单元
HD7970的2048个流处理器被划分成了32个并行计算单元(Compute Unit),每个计算单元都相当于一个运算中枢,在芯片高负荷时,每个计算单元都能同时分配、执行指令,架构利用率和吞吐量很高,更适合处理多线程多任务并行运算。>>
[page]
AMD HD7970显卡GCN架构解析(二):
HD7970架构中的2048个流处理器组成了32个并行计算单元,如此一来,每个计算单元内部就具有64个流处理器,这64个流处理器组成了4个矢量单元(Vector Unit),每个矢量单元搭配64KB矢量寄存器。GCN架构内,每4个计算单元组成一个运算小组,配备了数据寄存器和一些辅助性功能模块,从而组成了一个完整的运算中枢(类似于一个纯计算功用的核心集群)。
GCN计算单元结构示意图
GCN架构中的这些计算单元,是基于SIMD普通指令集的结构模式,抛弃了以往的VLIW(超长指令字)的打包吞吐模式,单个计算单元灵活度、独立性更高,每个计算单元都能同时领取、执行指令,众多计算单元并行处理能力很高,架构利用率和指令吞吐量比VLIW模式更高。
完整的GCN架构(居中的是32个并行计算单元)
接下来我们再深入一层,分解一下矢量单元。GCN架构代表着从VLIW4 SIMD向Quad SIMD的进化,前者采用一个VLIW指令和四个ALU操作的方式,内部的16个流处理器一字排开,类似一个一维流水线,更适合机械的高负荷图形运算,而在变量比较多的通用计算上,流水线会反复陷入重置、等待、调用周期,执行效率被浪费。
从VLIW4架构到GCN架构,矢量单元运作方式的变化
而GCN与前代产品相比,在最底层的微架构层面上就有着显著的不同。GCN架构矢量单元的内部结构是四个SIMD单元加一个ALU操作,内部的16个流处理器具有多变的组合模式,类似一个能应变组合的方阵,能将各种指令分类后再分派执行,大大增强了计算的灵活性。
由此我们可以看出,由于设计理念的转变,GCN架构在为体系上已经与前代产品有很大的不同,GCN不再单纯的追求吞吐量,而是将重点转向了灵活性、效率提升,整个架构从最基层开始就更为灵活的运算优化,架构中层的运算单元在并行效率上也有针对性的效率改进,整个GCN架构更面向“通用计算就是图形计算”的未来趋势。
GCN驾构:更高效更前卫
近年来,GPU芯片通过堆流处理器换性能的做法,也有不少架构上的缺点,比如寄存器端口冲突、调度指令复杂等,因此越多流处理器越难以达到理论峰值性能。HD7970的GCN架构在规划上更为清晰、直接,32个并行运算单元,很有针对性的解决了寄存器端口的冲突问题,以高灵活度消除了很多潜在的逻辑死锁现象,从而使得芯片性能更稳定,实际性能表现更接近理论预测值。>>
[page]
AMD HD7970显卡DX11.1/PCI-E3.0前卫规格解析:
在28纳米工艺、GCN新架构之外,HD7970还有两项关键性新特性,这就是DirectX(简写DX)11.1支持与PCI-E 3.0接口。DirectX API是微软发布的游戏接口,可以看作是一个游戏渲染技术/建模技术的汇集,微软借助DirectX API规范,控制着PC游戏/显卡硬件行业,每代DX版本的更新,都会引起显卡行业的更新换代、巨头角力、甚至惊涛骇浪。当前,Windows XP平台上一般运行的是DX9.0c,而Windows 7平台上则运行的是DX11。
DX可以看作是一个渲染技术/建模技术的汇集
DX可以看作是一个渲染技术/建模技术的汇集,新版本的DX可以支持游戏实现更多、更新的特效,而且可以提升显卡执行某些特效时的运算效率,因此,对DX版本的支持,不仅代表着游戏画质的层次,更代表着显卡硬件的层代。当前,业界游戏大作已经基本普及DX11,NVIDIA GTX500、AMD HD6000系列显卡也都已经是第二代DX11显卡了。
DX11曲面细分技术实际游戏画面(Crysis 2)
DX11.1要等到Windows 8操作系统正式发布才会真正面世,AMD HD7970显卡目前只是在硬件上做好了准备,DX11.1还暂无用武之地,催化剂驱动也不会开启它。第一款开启DX11.1的驱动将会出现在Windows 8 Beta公开测试阶段。DX11.1最大的改进就是将3D立体显示技术正式写入了D3D API,3D立体显示技术将成为成为一种通用标准,游戏开发也将更加简单,这有望为业界酝酿已久的PC 3D显示技术真正打开局面。
HD7970:第一款DX11.1显卡、第一款PCI-E 3.0接口显卡
PCI-E 3.0标准主要是将信号传输率提高到8GT/s,两倍于PCI-E 2.0,同时伴随有一系列的信号稳定性优化。当前只有Intel X79主板平台可以支持PCI-E 3.0,X79主板需要搭配“天价”SNB-E处理器使用,而且当前PCI-E 2.0接口的数据带宽都还远未成为显卡的性能瓶颈,在PCI-E 3.0接口下,业界泄露出来的HD6970实测性能仅有极其微弱幅度的增长,因此,PCI-E 3.0接口其实也是噱头大于实际。
当前只有X79主板平台可以支持PCI-E 3.0
HD7970显卡运行在PCI-E 3.0模式下
在稍后的测试中,我们也将对HD7970显卡在PCI-E 1.1、PCI-E 2.0、PCI-E 3.0三种接口模式下的性能进行一番对比测试,看看当前主板的PCI-E接口是否会成为最顶级显卡性能发挥的限制。>>
[page]
AMD HD7970显卡EyeFinity2多屏输出/HD3D显示技术解析:
A卡当前的三屏输出技术是一大亮点,中低端A卡都可以完美支持三屏独立输出,中高端A卡更是可以借助DisplayPort接口和AMD Eyefinity (宽域)技术,为高端玩家带来更加个性化、人性化的更多屏“液晶墙”体验。
在AMD HD7970显卡上,AMD Eyefinity (宽域)技术进化到了第2代
在AMD HD7970显卡上,AMD Eyefinity (宽域)技术进化到了第2代,显卡仍然具备DVI+HDMI+2个DisplayPort输出接口,每张显卡可以轻松支持三台显示器。而且借助DisplayPort转接线缆,HD7970显卡单卡即可组建6屏显示输出,每屏分辨率也比上代产品更高,规格非常超前。
HD7970单卡三屏游戏体验
多屏显示在当前高端玩家中是一项非常前卫的技术,借助AMD Eyefinity(宽域)多屏显示技术,玩家可以用A卡轻易搭建起个性化的多屏显示平台,从而尽享震撼游戏体验,会轻松扩展桌面空间。
AMD Eyefinity2 技术可以搭建个性化的多屏显示墙
HD7970的2个DisplayPort 1.2接口可以借助转接线缆,实现6屏显示输出
3D显示技术当前正在逐渐成熟,业界各大硬件厂商都在纷纷出台自家的3D显示方案。当前,在PC 3D显示领域,AMD推出的基于开放式标准的HD3D解决方案,与NVIDIA主导的3D Vision方案,以及部分显示器厂商主导的的偏振式3D显示方案,在DIY领域形成三种声音。AMD HD3D是AMD所开发的,基于开放式标准的HD3D技术解决方案,支持Bit Cauldron、XpanD、RealD等多种3D眼镜解决方案,提供对蓝光3D电影完全解码和DirectX 9、DirectX 10、DirectX 11游戏支持。
AMD HD3D开放式3D显示技术
AMD HD7970显卡3W待机功耗/通用运算技术解析:
低功耗是A卡的一大亮点,同等级显卡,A卡满载功耗要比对手低20-40W,节能幅度很可观。在HD7970上,显卡在整机待机时的功耗更是被节减到了仅仅3W。
AMD近年来数代显卡待机功率
而且借助28纳米新工艺,HD7970满载功率也只是与HD6970相当,要知道HD7970核心晶体管数量几乎两倍于HD6970,实际游戏性能1.4倍于HD6970,而功耗却没有随之疯长。
HD7970:最强性能+最强节能
前面我们说过,AMD GCN架构设计思路更在乎高性能运算,因此HD7970通用运算性能也很强悍。在WinZip16.5版本上,WinZip将可利用OpenCL加速压缩/解压缩/AES加密的编码速度,OpenCL应用允许负载在CPU核心、整合GPU和独立显卡之间按需分配。HD7970显卡在进行此项运算时,可加速系统十倍以上。
在WinZip16.5版本上,HD7970显卡可加速系统十倍以上
当前众多可以利用显卡通用运算加速的应用程序
当前,从网页浏览到科学运算,从平面设计工程绘图,很多软件都已经可以借助显卡的通用运算能力获得加速,如何利用显卡的通用运算性能,也是时下PC运算中的热门议题。HD7970显卡强悍的高性能运算能力,正在会的越来越多的用武之地。>>
[page]
AMD HD7970公版显卡外观赏析:
AMD Radeon HD7970公版显卡仍然采用红黑主色调设计,表现着一种强大动力呼之欲出气势。但相比于前几代A卡公版旗舰,这次的HD7970边缘线条变得柔滑了很多,散热器的高光塑料外壳也显得明净细滑,更显年轻前卫气质。公版显卡核心/显存频率设定为925/5500MHz,显存容量3GB。
AMD Radeon HD7970公版显卡
在此次AMD Radeon HD7970首发测试中,我们率先收到的是来自迪兰的显卡实物,因此我们的产品拍照、测试都是在这款产品上进行的。这是一款标准的AMD公版显卡,只是在散热器上贴上了迪兰的logo。
AMD Radeon HD7970公版显卡
显卡依然采用涡轮风扇散热设计,风量十足,防尘性也很出色。但涡轮风扇的噪音也是有耳共听的,特别是当风扇高负载时。接下来各大显卡厂商的第三方大口径风扇散热器有望解决噪音问题。
AMD Radeon HD7970公版显卡
AMD公版HD7970显卡外接供电接口为8pin+6pin,显卡满载功耗在280W以内。
AMD HD6970与HD7970公版显卡对比
与AMD上一代旗舰HD6970相比,HD7970长度、体积、接口布局都完全一致,但高光外壳看起来更显前卫。另外,这次的公版显卡也有一些“缩水”之处,显卡背部省掉了起保护、辅助散热作用的背板。
AMD HD6970与HD7970公版显卡对比
各款公版显卡外观对比
各款公版显卡外观对比
HD7970显卡输出接口
显卡具备DVI+HDMI+2个DisplayPort输出接口,接口组合以数字信号输出为主,更适合高端玩家。而且要想组建三屏输出,玩家就必须利用至少一个DP接口。
HD7970显卡背部图
从背面来看,显卡PCB依然保持了很高的做工水准,高水准的贴片工艺,让HD7970不失A卡历代公版旗舰卡的典范。>>
[page]
AMD HD7970公版显卡拆解解析:
HD7970显卡采用的是384bit显存位宽设计,因此PCB上的显存颗粒增加到了12颗,这也是AMD自HD2900XT以来,首次在旗舰芯片上使用超过256bit显存位宽规格。显卡显示核心采用45度倾斜角摆放。
HD7970显卡拆解
公版HD7970显卡散热器采用的是真空腔均热板方案。与现在中高端显卡上常见的热管散热方案相比,真空腔均热板可以看作是一个更大面积的“热管腔体”,有效导热面积更大,吸收、散发热量时更高效,散热器内部温度分布也更均匀。
HD7970显卡的均热板散热器
显卡铜质均热板上方附着着密集的金属鳍片,构成了很大的散热面积,鳍片间的缝隙则构成了涡轮风扇的散热风道,可以在显卡输出接口挡板处将热风直接排出机箱外。
HD7970显卡散热器拆解
由于采用的是28纳米工艺,因此HD7970显卡的“Tahiti”显示核心,芯片面积近365平方毫米,让人完全无法相信这会是一颗集成了43亿晶体管、数倍于顶级CPU核心规模、当前规模最大的PC芯片。
HD7970显卡的“Tahiti”显示核心
另外,“Tahiti”显示核心上不再有任何字符铭刻,但核心周围具有金属镂空造型承压垫,GPU芯片的标志字符就铭刻在这块金属承压垫上,芯片编号为215-0621080。
HD7970显卡PCB
显卡供电电路
显卡供电电路
显卡供电电路采用的是5+1+1相数字PMW供电设计,用料为铁素体电感、日系固态电容、DirectFet铜金属封装Mosfet组合方案,规格绝对扎实。数字供电电路电压控制更精稳、抗干扰能力更强,成本也远较模拟供电电路高昂。
显卡的双BIOS切换开关
公版HD7970显卡同样具有双BIOS切换功能,但两颗BIOS芯片出厂信息是完全一样的,因此拨动这个开关,显卡运行频率不会变化。但双BIOS的好处是可以为显卡提供备份BIOS,从而让玩家可以放心刷卡、简单恢复刷坏的BIOS。 >>
[page]
测试成绩分析:
接下来,为了给大家提供一个清晰、准确的性能感受,我们将今天的测试数据进行了一番处理、编进了下面的表格,并给出了清晰的性能对比幅度。
测试成绩总汇 | ||||
项目 | 测试 | AMD HD7970 | NVIDIA GTX580 | 对比 |
3Dmark 11 | ||||
![]() | P档总分 | 7996 | 6747 | 19%↑ |
X档总分 | 2735 | 2105 | 30%↑ | |
使命召唤8:现代战争3/DX9最高画质/4AA | ||||
![]() | 1920x1080 | 130 | 111 | 17%↑ |
2560x1600 | 90 | 68 | 32%↑ | |
战地3/DX11最高画质/4AA | ||||
![]() | 1920x1080 | 67 | 55 | 22%↑ |
2560x1600 | 41 | 32 | 28%↑ | |
孤岛危机2/DX11最高画质/4AA | ||||
![]() | 1920x1080 | 46 | 33 | 39%↑ |
2560x1600 | 27 | 19 | 42%↑ | |
科林麦克雷:尘埃3/DX11高画质/4AA | ||||
![]() | 1920x1080 | 157 | 150 | 5%↑ |
2560x1600 | 116 | 97 | 20%↑ | |
异形大战铁血战士/DX11最高画质/4AA | ||||
![]() | 1920x1080 | 61 | 49 | 24%↑ |
2560x1600 | 35 | 29 | 21%↑ | |
Heaven Benchmark 2.5/DX11高画质/4AA | ||||
![]() | 1920x1080 | 59 | 46 | 28%↑ |
2560x1600 | 34 | 26 | 31%↑ | |
平均:26%↑ |
从上面的测试结果可以看到,HD7970平均性能超越GTX580约26%,显示了HD7970新一代旗舰显卡的强悍性能。在2560x1600高分辨率下,HD7970领先幅度更是高达30%,由此看来,在高负荷下,新架构威力的确不容小视,AMD此次的架构更新,带来了实实在在的运算效率大幅提升,强悍性能没有让人失望。
PConline评测室总结:
AMD Radeon HD 7970 图片 评测 论坛 报价
AMD Radeon HD 7970是业界第一款28纳米GPU图形芯片、业界第一款DX11.1显卡、业界第一款PCI-E3.0接口显卡,在微架构层面上,HD7970的GCN架构就有了很大的优化改进,并带来了巨大的性能提升,是一款面向未来游戏/高性能运算的前卫新一代显卡。相对于当代最强单芯显卡GTX580,HD7970性能提升幅度在30%左右,这样的优势,足以确立HD7970“新一代旗舰”的地位。HD7970的率先发布+大幅性能优势,也必将给竞争对手带来巨大压力。
HD7970的GCN架构,是对AMD GPU设计理念的一次大幅变革。HD7970不再单纯的追求理论图形渲染性能,而是更注重于通用运算性能的提升。在GCN架构内部,2048个流处理器组织方式更显灵活高效,各运算单元独立性更强,更能适应未来的高性能运算需求,而且增强的通用运算性能,也随之带来了更强悍、更实际的图形性能。从今天的测试中,我们也确实看到:初生的HD7970显卡,在配合催化剂11.12时,就已经展现出了巨大的游戏性能提升幅度,强悍性能已不仅仅是停留在理论的浮点运算性能层面。
HD7970(Tahiti)核心面积比HD6970(Cayman)还小
HD7970显卡的“Tahiti”显示核心,内部集成度达到了43亿个晶体管之巨,数量比上一代产品几乎翻倍,但借助28纳米工艺,Tahiti核心面积却比上一代产品还小,显现了新工艺的巨大威力。而且HD7970实测满载温度也只是与上一代产品相当,功耗/温度控制的相当出色。由此看来,相对于上一代产品,HD7970的优势可以说是全方位的,就此而言,HD7970已经揭开了下一代显卡变革的大幕。[返回频道首页]
[page]XFX HD7970显卡赏析:
在此次AMD HD7970显卡发布上,XFX反应速度非常快。在第一时间,XFX不仅推出了公版HD7970显卡,而且非公版散热器方案的产品也随之面世,一起来看看这两款产品。
XFX R7970显卡(公版设计)
XFX R7970显卡(公版设计)
XFX R7970显卡(公版设计)
XFX R7970显卡(公版设计)
XFX R7970显卡(公版设计)
XFX R7970显卡(公版设计)
XFX R7970显卡参数 | |
核心频率 | 925 MHz |
显存频率 | 5500 MHz |
显存容量 | 3GB |
显存位宽 | 384 bit |
接口布局 | DVI+HDMI+DisplayPort+DisplayPort |
接下来的这款XFX R7970双风扇版显卡,是业界第一款非公版散热方案的HD7970,显卡采用8厘米大口径双风扇设计,风扇下散热片面积更大,散热效果更强悍、更冷静。显卡PCB则完全沿用公版方案,但频率设定达到了1000/5700MHz。
XFX R7970显卡(非公版散热器)
XFX R7970显卡(非公版散热器)
XFX R7970显卡(非公版散热器)
XFX R7970显卡(非公版散热器)
XFX R7970显卡(非公版散热器)
XFX R7970显卡(非公版散热器)
XFX R7970显卡(非公版散热器)
XFX R7970显卡(非公版散热器)
XFX R7970显卡(非公版散热器)
XFX R7970显卡参数 | |
核心频率 | 1000 MHz |
显存频率 | 5700 MHz |
显存容量 | 3GB |
显存位宽 | 384 bit |
接口布局 | DVI+HDMI+DisplayPort+DisplayPort |
[page]
蓝宝HD7970显卡赏析:
蓝宝此次送测的HD7970显卡是一款完全公版产品,卡身上有蓝宝品牌贴纸。显卡频率设定也与公版一致,为925/5500MHz。显卡输出接口组合为DVI+HDMI+DisplayPort+DisplayPort。
蓝宝HD7970显卡
蓝宝HD7970显卡
蓝宝HD7970显卡
蓝宝HD7970显卡
蓝宝HD7970显卡
蓝宝HD7970显卡
蓝宝HD7970显卡
蓝宝HD7970显卡参数 | |
核心频率 | 925 MHz |
显存频率 | 5500 MHz |
显存容量 | 3GB |
显存位宽 | 384 bit |
接口布局 | DVI+HDMI+DisplayPort+DisplayPort |
京ICP备14006952号-1 京B2-20201630 京网文(2016)1650-207号 沪公网安备 31011202006753号未成年人举报:legal@3dmgame.com
CopyRight©2003-2018 违法和不良信息举报(021-54473036) All Right Reserved
玩家点评 (0人参与,0条评论)
热门评论
全部评论