前言:现在的手持多媒体设备可以说非常普及了,例如智能手机、平板电脑、游戏机、MP4播放器等等,越来越多用户喜欢把电影、电视剧放到这些手持设备上,方便随时观看。但与电脑不同,各类手持设备支持的视频都有限制,往往需要进行转码(俗称压片)才能播放,而转码对传统CPU性能是一大考验,即便用到高端四核CPU,速度也不能让人满意。
但是CUDA出现后,使用支持该技术的NVIDIA显卡可以大幅度提升转码速度,对于常压片的用户来说确实是福音。现在,从入门到高端的N卡都支持CUDA,按道理说应该是越高端的显卡,压片速度越快,但事实是顶级的GTX580压片只是浮云,不比入门级的GT240快多少......
在进入正题之前,我们先谈谈为什么NVIDIA显卡可以用来“压片”,这主要是NVIDIA的显卡CUDA技术的功劳。CUDA(Compute Unified Device Architecture,统一计算设备架构)是一种由NVIDIA推出的通用并行计算架构,通过该架构可以使软件能利用GPU众多的核心来解决一些复杂的并行计算,例如视频转码。
GPU的核心数远超CPU,更好应付复杂的并行计算
视频转码过程是一个并行运算的过程,核心数众多的GPU相比CPU理论上拥有更强的运算能力,转码速度将快得多。我们知道,NVIDIA是根据GPU的核心数来划分GPU等级的,例如当前入门级的GT240,只有96个CUDA核心,而旗舰GTX580则拥有512个CUDA核心。理论上GPU核心数越多,压片速度就越快。
拥有512个CUDA核心的GTX580显卡
GPU | 核心数 | 核心频率 | 显存频率 | 参考价格 | ||
GTX 580 | 512 | 772MHz | 4008MHz | 3999元 | ||
GTX 560 Ti | 384 | 822MHz | 4008MHz | 1999元 | ||
GTX 460 | 336 | 675MHz | 3600MHz | 1399元 | ||
GTS 450 | 192 | 783MHz | 3608MHz | 899元 | ||
GTS 250 | 128 | 738MHz | 2200MHz | 699元 | ||
GT 240 | 96 | 550MHz | 3400MHz | 599元 |
但事实证明理论不一定完全正确,通过实测结果显示,512个CUDA核心的GTX580不比96个CUDA核心的GT240快。为什么会有这样的结果呢?本文将采用6款典型显卡和两款对CUDA支持比较好的转码软件进行验证分析。
为什么不用AMD显卡进行测试?
答:虽然AMD方面也有类似NVIDIA CUDA的技术,名叫Stream,但该技术成熟程度远不如CUDA,支持的软件也非常少,所以本文只用NVIDIA显卡来谈视频转码测试 。
[page]
2、评测平台介绍及方法说明
Intel平台 | ||||
CPU | Intel Core i5 760(4核/4线程) Intel Pentium G6950(2核/2线程) | |||
主板 | 华硕 Maximus III Formula(P55) | |||
内存 | 宇瞻 DDR3-1333 2GB x 2(8-8-8-24) | |||
硬盘 | 日立 1TB | |||
显卡 | GTX 580(512 CUDA核心) GTX 560 Ti(384 CUDA核心) GTX 460(336 CUDA核心) GTS 450(192 CUDA核心) GTS 250(128 CUDA核心) GT 240(96 CUDA核心) |
软件平台 | ||||
操作系统 | Windows 7 Ultimate X64 SP1 | |||
驱动程序 | 显卡: ForceWare 266.58 For Win7 | |||
评测软件 | 软件: MediaCoder NT CUDA MediaConverter 7.1 |
本次评测的主题是考察低中高端显卡的视频转码速度,因此我们选择了市场上比较有代表性的6款NVIDIA显卡。为验证CPU对显卡转码速度的影响,我们采用了Core i5 760和Pentium G6950两款CPU进行比较。考虑到软件对CUDA的支持度,软件方面选择了比较成熟的MediaCoder NT CUDA和MediaConverter。
3、GTX580只是浮云?6款显卡压片测试
显卡转码测试部分,我们选择了对CUDA支持比较好的MediaCoder NT CUDA和MediaConverter两款软件,均是最新版本。为尽量避免CPU成为瓶颈,本部分测试采用的CPU为Core i5 760。
测试片源介绍:
片源一,海贼王487,RMVB编码,时长24分钟
片源二,变形金刚2,H.264编码,时长5分30秒
对于测试片源,我们选择了《海贼王》487话和《变形金刚2》,其中《海贼王》采用RMVB编码,分辨率为848x480,时长24分钟;《变形金刚2》采用H.264编码,分辨率为1920x1080,时长为5分30秒。目标格式均为iPAD的480P,H.264编码。
MediaCoder NT CUDA:
MediaCoder NT CUDA
MediaCoder是一个强大的音频/视频批量转码工具,它将众多来自开源社区优秀的音频视频软件整合于一个友好的图形界面。由于是免费软件且操作简单,在国内很受欢迎,我们采用的是专门为CUDA优化的版本,可能是软件设定了日期限制,需要把日期调整到2010年12月1日之前才能正常使用。
480P/RMVB转480P/H.264
1080P/H.264转480P/H.264
MediaConverter 7.1:
MediaConverter 7.1
MediaConverter可以将图片、视频和音乐文件转换成便携设备的理想播放格式。仅需简单的操作,即可将媒体文件进行高效、高品质转换,在MP4播放器、iPod、PSP和其它便携式媒体播放器上播放。由于MediaConverter不支持RMVB源文件,所以这部分没有测试。
1080P/H.264转480P/H.264(MediaConverter 7.1不支持GTX580)
测试小结:相比CPU编码,CUDA显卡编码确实带来更高的效率,尤其是不同编码格式转换的时候(RMVB转H.264),CUDA显卡比Core i5 760级别的CPU快了近45%,相同编码之间的视频压缩(H.264转H.264),CUDA显卡提速相对较小。
无论是MediaCoder还是MediaConverter,采用GTS250以上的显卡对转换速度基本一致,并没有因为核心数的增加而加速, 表明主流的转码软件还没有利用或用不上128个以上的CUDA核心。如果是还没利用上,可以等待软件的优化;如果是根本用不上,那么压片的话GTX580也只是“浮云”而已。笔者认为后者的几率更高。
[page]
4、CPU性能对显卡编码的速度是否有影响?
MediaCoder NT CUDA
用显卡编码可以大幅度提高效率,那么是否意味着CPU的性能就不重要呢?为此我们用Pentium G6950和Core i5 760两款CPU进行验证。测试片源为《海贼王》487话,采用RMVB编码,分辨率为848x480,时长24分钟。
CPU性能对GPU编码速度的影响
可以看到,Core i5 760平台的测试结果比Pentium G6950仍要快很多,表明显卡进行编码时,CPU的性能仍是很重要的。毕竟显卡编码时,CPU仍要参与大量的运算,显卡没有完全脱离了CPU。只有CPU与GPU搭配合理,才能发挥平台的最佳性能。
5、CPU/显卡编码的画质比较
或许会有不少网友质疑CPU编码和显卡CUDA编码的画质问题,于是我们进行了比较。本节的画质比较仅针对便携设备支持的低分辨率(480P以下)进行,不代表高分辨率是这样的结果。下面图片采用无损压缩的PNG格式。
显卡CUDA编码
CPU编码
显卡CUDA编码
CPU编码
显卡CUDA编码
CPU编码
根据笔者的经验,显卡CUDA和CPU编码的视频,低分辨率时两者画质区别确实不大,无论动画片还是电影均是如此,因此打算把动画片或电视剧放进移动便携设备的用户,可以放心选择效率更高的CUDA编码。
[page]
6、PConline评测室总结
评测成绩汇总:
MediaCoder NT CUDA评测成绩汇总(各显卡与i5 760比较) | ||||
项目 | 480P/RMVB 转 480P/H.264 | 1080P/H.264 转 480P/H.264 | ||
GT 240 | ↑ 46% | ↑ 7% | ||
GTS 250 | ↑ 46% | ↑ 7% | ||
GTS 450 | ↑ 45% | ↑ 8% | ||
GTX 460 | ↑ 46% | ↑ 8% | ||
GTX 560 Ti | ↑ 46% | ↑ 7% | ||
GTX 580 | ↑ 45% | ↑ 7% |
MediaConverter 7评测成绩汇总(各显卡与i5 760比较) | ||||
项目 | 480P/RMVB 转 480P/H.264 | 1080P/H.264 转 480P/H.264 | ||
GT 240 | n/a | ↓ 1% | ||
GTS 250 | n/a | ↑ 21% | ||
GTS 450 | n/a | ↑ 23% | ||
GTX 460 | n/a | ↑ 23% | ||
GTX 560 Ti | n/a | ↑ 25% | ||
GTX 580 | n/a | n/a |
CPU性能对显卡转码速度的影响(显卡为GTX580) | ||||
项目 | 480P/RMVB 转 480P/H.264 | |||
Core i5 760 VS Pentium G6950 | ↑ 32% |
GTX580也只是浮云,压片GTS250级别足矣:
用于“压片”的话,GTX580也只是浮云...
不能否认,用支持CUDA的显卡来“压片”,相比CPU确实快很多,但显卡之间的比较,差距却很小,顶级的GTX580也只是“浮云”,和主流的GTS250是同一水平,要知道比较3D性能的话,前者是后者的3倍以上!原因是主流的转码软件还没有完全利用或根本用不上128个以上的CUDA核心。如果是还没利用上,可以等待今后软件的优化;如果是根本用不上,那么压片的话,还是首选一款强大的CPU吧。而笔者更倾向后一种观点。
“压片”应优先考虑CPU,GPU作为辅助:
压片应优先考虑高性能CPU,GPU作为辅助
对于常进行视频转码的用户,配电脑时应该首先考虑高性能的CPU,GPU作为辅助。毕竟即使用GPU进行转码,CPU仍会参与大量运算,CPU性能的强弱也将直接影响转码速度。因此,要配这样的“压片”电脑,CPU建议选择四核以上,显卡选择GT240或者GTS250级别即可。
京ICP备14006952号-1 京B2-20201630 京网文(2016)1650-207号 沪公网安备 31011202006753号未成年人举报:legal@3dmgame.com
CopyRight©2003-2018 违法和不良信息举报(021-54473036) All Right Reserved
玩家点评 (0人参与,0条评论)
热门评论
全部评论