gti为什么值得买(宣称买到就是赚到)
gti为什么值得买(宣称买到就是赚到)Volta架构GPU与其他GPU性能横评(ML任务)现如今,深度学习的发展大大促进了AI的进步和落地。为了掌握问题的真相,它需要利用大量数据积累学习经验,数据越多,模型的性能就越优秀,在空间内探索到的可能性也越多,换句话说,就是我们的AI会变得越来越聪明。推出VR代驾工具Holodeck VR和自动驾驶仿真平台DRIVE CONSTELLATION它们分别对应演讲的4个主题:惊人的图形、惊人的科学、惊人的AI和惊人的机器人。每个主题一结束,老黄就会掏出这句经典广告:The more you buy the more you save。综观整场演讲,深度学习大放异彩,产品倒向业务层面,而万众期待的消费级GPU却没有出现在哪怕一张PPT中,着实伤了不少观众的心。注:考虑到一天下来大家已经看了大量相关报道,加上论智高度垂直机器学习领域,因此本文只涉及“惊人的AI”的相关内容。
今天凌晨,英伟达第9届年度GPU技术大会(GTC)在美国加州圣何塞市的McEnery会议中心顺利开幕,公司CEO黄仁勋穿着他的新黑色皮夹克走上舞台,宛如新世纪的超级英雄(←官网这么比喻的,不要看我)。在大会上,老黄重点介绍的内容主要有以下几个:
-
推出世界上第一款基于Volta架构的新型专业级GPU Quadro GV100
-
推出医学影像超级计算机Clara
-
推出世界上最大的GPU DGX-2
-
推出VR代驾工具Holodeck VR和自动驾驶仿真平台DRIVE CONSTELLATION
它们分别对应演讲的4个主题:惊人的图形、惊人的科学、惊人的AI和惊人的机器人。每个主题一结束,老黄就会掏出这句经典广告:The more you buy the more you save。综观整场演讲,深度学习大放异彩,产品倒向业务层面,而万众期待的消费级GPU却没有出现在哪怕一张PPT中,着实伤了不少观众的心。
注:考虑到一天下来大家已经看了大量相关报道,加上论智高度垂直机器学习领域,因此本文只涉及“惊人的AI”的相关内容。
惊人的AI:Tesla V100 GPU现如今,深度学习的发展大大促进了AI的进步和落地。为了掌握问题的真相,它需要利用大量数据积累学习经验,数据越多,模型的性能就越优秀,在空间内探索到的可能性也越多,换句话说,就是我们的AI会变得越来越聪明。
Volta架构GPU与其他GPU性能横评(ML任务)
从性能来看,Volta无疑是目前最适合机器学习任务的GPU架构,它在性能上优于以前的Kepler,显存也有16个g。这次升级到32g后,V100将可以运行更大更深的神经网络模型、提高每次训练的批大小,同时整体提升模型预测的准确率。
惊人的AI:GPU DGX-2老黄为AI界带来的第二个“福利”是大型GPU丛——DGX-2。围观群众没有等来预想中的20系、11系核弹,而是直接等来了一颗氢弹。
-
20亿根晶体管;
-
2片Intel Xeon Platinum;
-
16块 NVIDIA Telsa V100;
-
可配备1.5TB DDR4内存;
-
内置512GB HBM2显存;
-
内置30TB NVMe SSD(最高可到60TB);
-
功率10KW,净重350磅(约合159kg);
有本事你拎起来啊
关于这颗GPU的介绍,任何成段的描述都是苍白的,所以我们只列出几个重要的数据,请各位自行体会。
-
DGX-2每秒最大带宽约为14TB/s;
-
如果以1GB一部电影来计算,DGX-2每秒可以下片14336部;
-
81900个CUDA核心,提供2千万亿次浮点计算的算力(世界上最快的超级计算机是125 petaflops,美国最快的是100 petaflops,而DGX-2有2 petaflops);
-
和六个月前发布的DGX-1相比,DGX-2的处理能力是前者的10倍;
-
5年前,Alexnet用2块GTX 580训练,耗时6天;今天,它用一台DGX-2进行同样的训练,耗时18分钟;
-
售价39.9万美元,约合250万人民币。
用250万一次性买断300台功率为180千瓦的双CPU计算机,成本是它的1/8,占的空间是它的1/6,能效还是它的18倍,你说是不是The more you buy the more you save?
这个世界需要巨型(贵)GPU!
惊人的AI:NVIDIA GPU CloudNVIDIA GPU云(NGC)是一个可以在任何地方运行的GPU加速平台。数据科学家和研究人员可以通过它快速构建、训练和部署神经网络模型,以解决一些最复杂的AI挑战。而老黄公布的第三个消息就是NGC现在已经通过AWS、Google Cloud、Oracle云和阿里云认证,成为在这些云平台上唯一被允许运行的加速工具。
据官网介绍,NGC集成了当前所有领先深度学习框架、cuDNN、NCCL、TensorRT、GPU drivers、NVIDIA CUDA以及Linux操作系统,方便研究人员随时进行创新。由于允许灵活地将文件保留在本地,并在云平台上直接做训练和推理,数据科学家和研究人员今后将不再受计算资源限制。
惊人的AI:TensorRTPLASTER,分别代表:Programability(编程能力)、Latency(延时)、Accurate(准确率)、Size(体量)、Throughput(吞吐量)、Energy efficiency(能效)、Rate of learning(学习率)。这是机器学习中的一些重要概念。如果你要构建一台PC,这不是件简单的事;如果你要构建的是超级计算机,这更难;如果你要让计算机进行推理,那它必须符合PLASTER原理。
TensorRT是英伟达于2016年9月推出的一个可编程推理加速器,它能加速现有和未来的网络架构。历经几轮迭代,这次老黄介绍的TensorRT 4可以处理循环神经网络,深入融入TensorFlow,加速语音识别、NLP等任务的处理。
-
图像处理:加速190倍;
-
NLP任务:加速50倍;
-
推荐引擎:加速45倍;
-
语音识别:加速36倍;
-
语音识别率:提高60倍。
总而言之一句话:时间就是金钱。最后,虽然日前有新闻爆出售价两万的TITAN V连生物学中的2 2都算不对,但老黄表示:TITAN V仍处于缺货状态。
被忽视的两个群体:玩家和矿工看完了这个到处弥漫着深度学习气息的发布会,各位想必都发现了,在这样一个万众瞩目的盛会上,有两个重要群体却几乎没有被老黄提及:游戏玩家和数字加密货币矿工。
这两个群体一直热切期待着下一代GPU的发布。一方面,矿工们希望英伟达能推出新一代专为矿机设计的挖矿GPU,尽可能地多提高一点哈希率。另一方面,被暴涨的显卡价格压得喘不过气来的游戏玩家则希望GPU价格能回归正常水平,无论是矿机显卡还是备受关注的GTX 2080,新品都能解这个燃眉之急。
但是,无论是昨天还是今天,玩家和矿工的眼前暂时还会是一片黑暗。除了这个全球最大的GPU DGX-2可能会引起大矿主的兴趣,老黄并没有带来任何消费级显卡的消息。事已至此,玩家们似乎只能苦笑着调侃:老黄,你这个250万的DGX-2,跑得动扫雷不?
我们都知道,GTC不是一个以游戏为重点的活动,但是如果显卡商愿意在活动中暗示或透露即将发布的新品,这也是一个很好的契机。大会召开前,网上流传着各个版本的小道消息,玩家们在将信将疑的同时也寄期望于黄仁勋的正式发言,被肯定或是被否定,他们至少还有梦想,还有期待。但是显然,英伟达是不会为了照顾玩家感受走漏风声的。
“The more you buy the more you save.”老黄在整个主题演讲中一遍又一遍强调着这句话。买得越多,省得越多,转成商场里常见的标语,就是买到就是赚到。但是对于现实中被英伟达无视的这些人来说,买什么?拿头去买?我们甚至连价格合理的GPU都没得买。
我们来看看几款主流显卡的价格变化情况:
GeForce GTX 1060 6GB近18个月价格变化情况(单位:美元)
GeForce GTX 1070 Ti近18个月价格变化情况(单位:美元)
GeForce GTX 1080 Ti近18个月价格变化情况(单位:美元)
2017年4月,Nvidia GeForce GTX 1060的零售价大概在200美元左右,而截至今年3月,1060 6GB在newegg上的售价大多在350美元以上,而国内某东上的最低价也在2500以上。与此同时,GTX 1080 Ti最初定的零售价约为700美元,但现在它在newegg上早已突破1000美元大关,在亚马逊上濒临售罄,在某东上的价格也是低则7000,高则逼近万元。
有人说,矿难持续的越久,崩盘的时候就越可怕。但在遥遥无期的矿难前,显卡这种电子产品都快变成储值产品了,玩家不仅早买早享受,还能低进高出,把显卡当英伟达的股票玩……哦不
老黄是美国时间上午9时上台的,看来英伟达的显卡还是比公司的股票保值多了。