深度学习硬件配置(深度学习装机指南)
深度学习硬件配置(深度学习装机指南)1. 机箱总计:23100元(不包括显示器)第一套方案是预算为8000元的深度学习标准型台式机,这款台式机能够运行市面上几乎所有的大型游戏,完美全特效不掉帧,同时还可以顺便玩一下深度学习应用,例如奇特的风格融合。这套配置可以满足目前深度学习大部分的训练需求。配件名品牌型号数量价格机箱美商海盗船 400C 中塔侧透机箱1749 京东主板华硕 Z170I PRO GAMING Mini-ITX主板11299 天猫CPU英特尔 I7 7700K 酷睿第7代处理器11799 - 2799内存美商海盗船 复仇者8G DDR4 24002798 京东SSD三星850 EVO 250G M.2 固态硬盘1699 京东机械硬盘西部数据 蓝盘 2TB 64M 台式机硬盘1499 京东GPU七彩虹GTX1060 6G超频版游戏显卡11799 天猫电源美商海盗船VS650 额定650w电源1399 京东CPU风
王新民 友情贡献
量子位 出品 | 公众号:QbitAI
研究深度学习该买一台什么样的电脑?我的笔记本能满足需求吗?
量子位请来小伙伴,为当前的深度学习网络训练提供了两套最新的装机方案。
第一套方案是预算为8000元的深度学习标准型台式机,这款台式机能够运行市面上几乎所有的大型游戏,完美全特效不掉帧,同时还可以顺便玩一下深度学习应用,例如奇特的风格融合。这套配置可以满足目前深度学习大部分的训练需求。
配件名 品牌型号 数量 价格
总计:8200 - 9200元(不包括显示器)
第二套·土豪版
配件名 | 品牌型号 | 数量 | 价格 |
---|---|---|---|
机箱 | 美商海盗船 600C 中塔侧透机箱 | 1 | 999 京东 |
主板 | 华硕 /Asus X99-M WS/USB 3.1主板 | 1 | 2599 天猫 |
CPU | 英特尔 I7 6800K 酷睿第7代处理器 | 1 | 3399 天猫 |
内存 | 美商海盗船 复仇者16G DDR4 3000 | 2 | 1878 京东 |
SSD | 三星960 EVO 500G M.2 NVMe SSD | 1 | 1799 京东 |
机械硬盘 | 西部数据黑盘 2TB 64M台式机硬盘 | 1 | 999 京东 |
GPU | NVIDIA TITAN X 12G Pascal(可替1080TI) | 1 | 9699 京东 |
电源 | 美商海盗船 额定750W金牌电源 | 1 | 969 京东 |
CPU散热器 | 美商海盗船H80i V2 CPU水冷散热器 | 1 | 759 京东 |
显示屏 | AOC I2279VW 21.5英寸显示器 | 1 | 699 天猫 |
总计:23100元(不包括显示器)
下面我们对这些配件分别进行分析:1. 机箱
机箱的选取需要考虑两个问题:
1. 主板、CPU散热器是否能够装得下;
2. 整体散热性和稳定性是否满足需求。
先说标准版配置,在进行入门研究只用一块显卡的情况下,散热不存在问题,推荐海盗船400C的中塔机箱,小巧稳定。
对于土豪版配置,由于采用了华硕的M款工作站主板,后期具有增加到两块显卡的可能性,适当地增大机箱的空间,建议选海盗船600C中塔机箱。
如果有上四路TITAN X的打算,那么需要选取散热条件更好、空间更大的机箱,可以用跟Nvidia DevBox同款的机箱,即Corsair Carbide Air 540,也可以是追风者PK515E或515ETG中塔机箱,个人觉得后者的颜值高一些,这两款都可以用来组装具有四路TITAN X的深度学习工作站。
2. 主板
主板的基本要求是稳定性足够好,具有较多的PCI-E Gen3 x16接口。
由于标准版配置只计划选用一块显卡,故选取了游戏级别的华硕 Z170I主板,该款主板只具有一个PCI-e Gen3 x16接口。
当按工作站要求来选择主板时,有两个指标:最好是X99平台和拥有较多的PCI-E Gen3 x16接口。华硕推出了两款工作站主板,分别是具有两路PCI-e 3.0 x16接口的Asus X99-M WS/USB 3.1工作站小板和具有四路PCI-e 3.0 x16接口的Asus X99-E WS/USB 3.1工作站大板。
所以,我们在第二套土豪版配置中采用了Asus X99-M WS/USB 3.1工作站小板,可以扩展到两路TITAN X或者是GTX 1080 TI。
具有四路TITAN X的Nvidia DevBox工作站用的是Asus X99-E WS主板,当有计划上四路TITAN X打算的话,主板可以选用Asus X99-E WS/USB 3.1工作站大板,避免由于后期扩展显卡但是主板存在局限性的问题。
3. CPU
选择CPU,主要是观察三个指标:主频,核心数和总线带宽。
在第一套标准配置中,由于是单机单卡,所以选择目前主频最高的I7-7700K。i7-7700k的散片价格为1799,质保一年;盒装价格为2799,质保三年。据销售称,这两者没有实质性的差异,可根据自身需求进行选择。
在单机多卡进行训练时,总线带宽是瓶颈,所以CPU的PCI-e lane越多越好,一般消费级的CPU,PCI-e总线根数是16 28或40,最大就是40,进一步提升带宽就需要上服务器CPU或者双路至强CPU了。
有40带宽的这个条件下,有5款CPU入围,分别是:
-
i7-5930K(2014.3 3.5G 15mb 6核)
-
i7-5960X(2014.3 3.0G 20mb 8核)
-
i7-6850K(2016.2 3.6G 15mb 6核)
-
i7-6900K(2016.2 3.2G 20mb 8核)
-
i7-6950X(2016.2 3.0G 25mb10核)
还有一款为28带宽的CPU i7-6800K(2016.2 3.4G 15mb 6核)。
Nvidia官方推出的DevBox工作站所使用的CPU是i7-5930K,由于版本的更新,所以经过参数比较,第二套土豪级配置最多使用两块显卡,上手i7-6800K是比较合适的。
如果有上四块显卡的可能,建议使用上述所提到的5款总线带宽为40的CPU。
4. 内存
消费级的i7 CPU最大支持内存是128G。深度学习工作站内存选取技巧:内存大约为显存的两倍。
因此,我们在第一套标准版配置中使用了16G DDR4 3000的内存,在第二套土豪级配置中使用了32G的内存。内存的可扩展性很强,可以在使用中根据实际的占用情况来进行增减。
5. SSD
系统盘需要使用一块SSD,能够进行高速数据读取和存储。当前SATA III接口的SSD最普遍也最便宜,不过由于上述的两个主板都具有一个M.2接口,可以买一个M.2 NVMe的SSD,速度比SATA III接口也有所提升。
利用主板的这个接口,可以根据容量的需求来选择容量为256G或者是500G的SSD,例如三星960 EVO 500G M.2 NVMe SSD。
6. 机械硬盘
机械硬盘分为日常蓝盘(家用存储)、NAS红盘(网络数据存储)、企业金盘(密集读取型)、监控紫盘(存储密集型)、游戏黑盘(高端存储型)。
硬盘数据存储要求稳定,不存在数据丢失。
蓝盘为日常家用,最为通用;黑盘极其稳定,但是在运行过程中声音较大;红盘多用服务器数据存储,声音较小。故在第一套标准版配置中选择家用蓝盘即可,在第二套土豪级配置中最为高端稳定的黑盘作为存储盘,同时金盘也是不错的选择。
7. GPU
Tesla GPU性能很强劲,双精度计算能力非常优秀,适用于研究深度学习的超级计算机,但是Tesla K卡(K40,K80)十分昂贵,K40的价格为27000,K80的价格为37000。据一部分科研工作者反馈,对于网络计算的精度不需要达到这么高。
国内的公司和科研机构一般是使用一块Titan X Pascal,或者是两块GTX 1080,随着新品的面世,GTX1080 TI也是一个不错的选择。
GPU是计算的关键要素,利用台式机GPU来研究深度学习,就是通过足够的CUDA单元,以及配套的显存资源,来进行深度计算。尽管GPU也存在频率和显存带宽的差异,但是对于大部分的网络训练,6G及以上都是满足要求的。下图是对常用显卡的一个比较,可见如果是大量扩展时,1080TI和1070是比较合适的。
在标准版配置中,只能上一块GPU,建议显存大于等于6G,版本高于等于GTX 1060,即可满足日常实验研究,训练VGG网络或者Alexnet网络都不是问题。
上升到X99工作站主板后,最多可插两块Titan X或者四块 GTX 1080TI(当然仍然可以使用GTX 1080),上面选择的PCI-e总线为40的规定用于此处。
GTX1080 8G显存的价格是4100元左右;GTX 1080 TI显卡的价格是5700元左右,性能可以和Titan X相媲美,目前性价比最高;Titan X 12G显卡的价格是9700元,比较适用单次任务显存占用量高的网络,运行速度大约是GTX1080的1.6倍。
因此,我们在第二套土豪版配置中上了一块TITAN X,当然你也可以换成GTX 1080 TI,这也是不错的选择,根据实际训练情况再进行添置GPU。
特别需要注意的是,千万别买同级别的AMD卡!
NVida对深度学习计算的支持远远好于AMD,不然你会沉浸于无穷无尽的加速库安装和环境配置之中。
8. 电源
电源最高功率的计算可以通过鲁大师的功率计算功能得出,将得到的功率乘以1.4倍就是所需要购买的实际电源瓦数。
在第一种标准版配置中,实际功率大约为150 150 100=400w,保留充足的余量,选择海盗船VS650w的电源。
在第二种土豪版配置中,实际功率大约为250 150 100=500w,选择USCorsair RM750x金牌电源。如果你的台式机可能后期会添加显卡,那么你可能要考虑到这个问题,最多加装两个TITAN X的话,1000w电源已经足够了。
9. CPU散热器
考虑到台式机运行过程中CPU散热量较大,可以进行加装CPU风冷,如第一套配置里所用的,也可以进行加装CPU水冷,在第二套土豪级配置中用到了海盗船的水冷散热器。
以上是对深度学习装备的分析,以及面对8000和20000元分别推荐的配置清单。
其实,作者自己曾经花费4万元组装了一台深度学习工作站,也愿意和大家聊一聊Ubuntu系统安装、TensorFlow、Caffe等框架的配置等等,欢迎来量子位微信公众号(QbitAI),在对话界面回复“装机指南”进行勾搭。