在今年NVIDIA GTC大会的主题演讲,NVIDIA执行长黄仁勋一开始就谈到后摩尔定律时代的革新,现在单线程性能的提升已经逐渐趋缓,而能够在此世代引领革新的关键,可说是基于GPU的偕同运算,而在近五年更可看到整个业界对于机于CUDA的偕同运算技术获得重视,GTC与会人员与CUDA开发者亦大幅增长。
基于照片仿真与VR的多人VR应用Project Holodeck
在今年GTC所宣布的第一项新技术,是称为Project Holodeck的VR虚拟协作应用,结合VR与照片仿真技术,让四个使用者可在同一环境检视以照片仿真绘制的工业产品以及3D内容,可作为工业设计、内容制作应用。
黄仁勋也与瑞典超级跑车制造商Koenigsegg创办人Christian von Koenigsegg联机,以Project Holodeck在VR环境中共同欣赏其最新的Regera混合动力超跑,再搭配及时运算,可进行全车结构的检视,同时与参与VR会议的同伙置身在相同的VR环境中;Project Holodeck预计在今年九月提供前期导入。
[page]
将深度学习用于Ray Tracing提升降噪效率
而后黄仁勋谈到深度学习对于整个产业的影响,在我们所认知包括搜寻、图像辨识、围棋、自动驾驶外,黄仁勋还指出深度学习亦可与3D图像的Ray Tracing的降噪技术结合,通过深度学习的方式学习包括图像去噪、光线反射等特性,使得设计3D模型后进行照片仿真的Rendering可更具效率且逼真。
SAP将人工智能用于广告露出效益分析
同时NVIDIA也宣布SAP基于DGX-1超级电脑与AWS打造全球首个商业级人工智能,这套系统被应用在商业广告效益分析,通过客户图像内容输入到基于NVIDIA深度学习的SAP的机器视觉系统后,找出广告在视频中的曝光情况;另外SAP也将这套系统应用在企业的发票分类处理,减少因人力导致出错。
[page]
基于Volta构架的首款产品Tesla V100
今年的重头戏,就是宣布基于全新的Volta构架的第一款产品Tesla V100,就如同当初宣布Pascal构架一样先是以运算级的Tesla产品做为首发;Tesla V100是一款拥有超过21亿个晶体管的核心,采用台积电12nm FinFET制程,封装尺寸与Apple Watch相似,达到815mm平方。
Tesla V100具备高达5,120个CUDA核心,内存采用三星16GB HBM2内存,达到900GBs传输速度,并具备全新的NVLink 2高速信道,达到300GBs的频宽;同时针对深度学习搭载全新的Tensor Core,运算能力可达到7.5 FP64 TFLOPS、15 FP 32 TFLOPS,并由Tensor Core提供120 Tensor TFLOPS。而Tesla V100开发金额超过300亿美金。
当然Tesla V100也不是只能做为人工制护应用,黄仁勋也展示由Square Enix以Tesla V100搭配游戏引擎进行即时图像处理的Kingsglaive: Final Fantasy XV展示,人物与场景模块都采自电影素材,不过藉由高性能的Tesla V100达到宛若电影处理后的效果。
同时NVIDIA也展示Tesla V100在包括Caffe 2、微软Cognitive Tookit以及亚马逊mxnet的性能提升,同时也请到亚马逊AWS的深度学习与AI总经理Matt Wood分享深度学习如何结合Alexa产生技术与应用的革命。
Tesla V100将提供从个人超级电脑到云超级电脑的完整阵容
随着Tesla V100,NVIDIA也宣布三款不同层级的服务器主机,包括企业级超级电脑DGX-1V,中小企业与个人版超级电脑DGX Station,以及与微软合作的公众云超级电脑HGX-1V,其中DGX-1V与HGX-1V皆是将既有服务器构架内的GPU从8张Tesla P100升级到8张Tesla V100的性能提升版,而DGX Station则是首度亮相的个人版超级电脑。
DGX-1V的建议售价为149,000美金,不过既有DGX-1的使用者,可免费升级到DGX-1V。
DGX Station是一款1,500W电源供应、水冷设计的小型超级电脑,采用四张以NVLink 2贯串的16GB Tesla V100,仍有高达480 Tensor TFLOPS的超高运算力,具备3个DisplayPort,售价为69,000美金。
[page]
针对TensorFlow的TensorRT
此外,黄仁勋还宣布了针对TensorFlow的TensorRT(Tensor Run-Time)软件,通过TensorRT使得Volta缩短12倍的训练时间以及加速6倍的逻辑演算性能,以图像处理速度来说,也让Volta的性能甚至相较Tesla P100高出7倍以上的处理能力。
针对HyperScale提供FHHL版Tesla V100
此外针对Hyperscale,黄仁勋也介绍了另一种特殊的Tesla V100封装,此种封装并非采用NVLink,而是使用工业标准的FHHL PCIe,尺寸宛若CD盒般,仅有150W TDP,性能达到Skylake的15-25倍,能将原本需要500台CPU构架的Node才能达到的运算力,以33台基于Tesla V100加速的Node达成,大量减少热排放与能耗。
让AI开发者可从端到云达到开发一致性的NGC
同时黄仁勋还宣布了NVIDIA GPU Cloud(NGC),让人工智能开发人员可藉由云平台进行AI的开发并使用最新的深度学习框架,并且宣布NGC软件套件,同时可在搭载Titan X或是GTX 1080 Ti的个人电脑以及DGX-1超级电脑甚至云主机使用相同的软件套件开发环境。NGC预计在今年第三季开始进行公众测试,服务订阅价格待后续宣布。
[page]
DrivePX获得丰田采用,Xavior搭载的Xavior DLA加速器将开源
在自动驾驶领域,黄仁勋宣布日本丰田汽车将与NVIDIA合作,以其DrivrePX作为自动驾驶车的核心构架;同时也补充了关于新一代自动驾驶硬件平台Xavior的构架,除了客制化的ARM 64位CPU以及Volta GPU以外,还具备称为Xavior DLA(Deep Learning Accessor)的深度学习加速器,可提供10 Deep Learning TFLOPS性能。
同时黄仁勋也宣布Xavior DLA将作为开源项目释出,预计在6月进行前期释出,而在9月正式进行开源。
ISAAC机器人模拟器加速基于Jetson机器人训练
此外也针对基于Jetson的机器人开发,宣布名为ISAAC的机器人模拟器,通过机于NVIDIA的GPU计算机仿真成Jetson,搭配ISAAC机器人模拟器进行虚拟培训,能够进行大量相同行为的机器人模拟学习,利用大量虚拟训练结果,使机于Jetson平台的机器人培训速度更快速。
京ICP备14006952号-1 京B2-20201630 京网文(2016)1650-207号 沪公网安备 31011202006753号未成年人举报:legal@3dmgame.com
CopyRight©2003-2018 违法和不良信息举报(021-54473036) All Right Reserved
玩家点评 (0人参与,0条评论)
热门评论
全部评论