景派资讯丨GPU计算平台---深度学习打工人的标配

2020-11-10 11:27:03 景派科技-市场部 69

深度学习是一种机器学习技术，可以教计算机去做人类自然想到的事情：通过示例学习。深度学习是无人驾驶汽车背后的一项关键技术，可让他们识别停车标志，或区分行人与路灯柱。它是电话，平板电脑，电视和免提扬声器等消费类设备中语音控制的关键。深度学习近来得到了很多关注，这是有充分理由的。它正在取得前所未有的结果。

深度学习的打工人都在哪些领域？

深度学习应用于从自动驾驶到医疗设备的行业。

自动驾驶：汽车研究人员正在使用深度学习来自动检测停车标志和交通信号灯等物体。另外，深度学习用于检测行人，这有助于减少事故发生。

航空航天与国防：深度学习用于从卫星上识别出目标区域，并确定部队的安全区域或不安全区域。

医学研究：癌症研究人员正在使用深度学习来自动检测癌细胞。已有科研团队构建了一种先进的显微镜，该显微镜可产生用于训练深度学习应用程序以准确识别癌细胞的高维数据集。

工业自动化：深度学习通过自动检测人或物体何时处于不安全的机器距离之内，从而帮助提高重型机械周围的工人安全性。

电子：深度学习已用于自动听力和语音翻译中。例如，响应您的声音并知道您的偏好的家庭辅助设备由深度学习应用程序提供支持。

深度学习是一个对计算有严格要求的领域，GPU的选择将从根本上决定了深度学习体验。如果想搭建能够满足深度学习计算需求的GPU计算平台，哪些功能很重要？GPU RAM，核心，张量核心？如何做出具有成本效益的选择？接下来，我们一起为深度学习的打工人，一一道来，解决常见的误解，如何考虑GPU拥有直观的理解，并为深度学习的打工人提供建议，展示景派科技的GPU计算平台解决方案。

目前的GPU型号有很多，RTX 3090 RTX 3080 RTX 2070、RTX 2080 Ti、GTX 1070、GTX 1080、GTX 1080·······等等

GPU深度学习性能对比测试

以下基准不仅包括Tesla A100 VS Tesla V100基准，通过模型拟合那些基于Titan V，TITAN RTX，RTX 2080 Ti和RTX 2080 [数据和四个不同的基准1，2，3，4 ]在更新中，还考虑了最近发现的RTX 30系列GPU的性能下降。

针对市场主流的GPU计算卡进行深度学习性能对比测试，接下来可以看到主流GPU卡的深度学习性能对比测试结果。

图1：相对于RTX 2080 Ti的标准化GPU深度学习性能。

与RTX 2080 Ti相比，RTX 3090的卷积网络速度提高了1.41倍，变压器的速度提高了1.35倍，同时发行价格提高了15％。

图2：1片或2片RTX 3080的深度学习性能。

图3：4片RTX 3080的GPU深度学习性能。

图4：8片RTX 3080的深度学习性能

我们会向有能力的深度学习打工人推荐RTX 3090。它在未来几年内，将是一张非常有效的卡片。因此，这是一项将保持强劲势头的良好投资。内存在三年内变便宜的可能性不大，因此下一个GPU仅比RTX 3090好25％。

对于博士生，想成为博士生的人或开始攻读博士学位的打工人，建议使用RTX 3080 GPU进行原型设计，建议使用RTX 3090 GPU进行推广。在允许的情况下，搭建GPU高性能计算集群，建议使用Slurm具有8个GPU高性能计算服务器的GPU集群。如果散热正常，建议使用66-80％的RTX 3080 GPU，其余GPU为RTX 3090或Tesla A100。如果冷却不起作用，建议使用66-80％的RTX 2080，其余为Tesla A100。

目前，景派科技在深度学习领域应用的“四件宝”，四个适用于深度学习的GPU高性能计算解决方案，都不同程度的满足了在深度学习不同领域的打工人的计算需求，接下来，逐一介绍。

入门级：景派T29EL/T29FL（机塔互换式GPU计算服务器）

景派T29EL/T29FL是景派科技推出的机塔互换4U低噪音产品，它采用IntelC612/C622高性能芯片组，支持E5V3/V4和Scalable系列处理器，该机型最多支持内存容量3TB，支持4块3.5寸非热插拔硬盘（可扩展至六块），高达1600W（根据需求配置）的电源输出使整机可最大支持四片双宽全高高性能GPU计算卡的全速运行功耗。可根据热关键器件温度综合调节风扇转速，节能的同时降低了噪音并提高风扇的可靠性。T29EL/T29FL提供先进的管理功能和存储技术，具有可靠的可扩充性和高可用性。

（4U，机塔互换式，1000W/1600W高性能认证电源，支持4块3.5硬盘（不支持热插拔），支持第二代英特尔®至强®可扩展处理器，最大支持4片双宽全高的GPU计算卡。）

景派T29EL/T29FL是一款能满足深度学习需求的入门级超算平台，基于第二代英特尔®至强®可扩展处理器设计的一款机塔互换式服务器，具有低噪音，可选用GPU计算卡，扩展性强等优势。

系统配置参数如下：

初级：景派R22FH（2U双路GPU计算服务器）

景派R22FH是景派科技推出的一款2U双路GPU计算服务器，它采用IntelC624高能芯片组，支持Intel®Xeon®Scalable系列处理器。该产品运用CPU+GPU计算卡，专为深度学习、人工智能、生命科学、云计算、金融建模、电子自动化等行业的重度计算用户设计，优化的系统散热方案，不仅保证了整机运作的可靠性，更能有效减少机器运行噪音，提供给用户一个高性能、高稳定的超算平台。

（2U，扩展核心机架，英特尔®服务器系统主板，1300瓦电源，205 W最大散热设计实力（TDP），支持8块3.5″硬盘，第二代英特尔®至强®可扩展处理器支持）

2U的机架系统具有高内存容量以及网络，存储和I / O限制，能够通过您业务的发展而扩展。基于英特尔服务器主板的系统支持英特尔®至强®可扩展处理器，支持2片双宽全高GPU计算卡，逐步解决您要求最严苛的HPC，云和存储工作负载需求。
系统配置参数如下：

超级：景派R22FG（2U双路GPU加速计算服务器）

景派R22FG是景派科技推出的2U双路机架式GPU加速计算服务器，它采用Intel C622高性能芯片组，支持Scalable系列处理器和四片双宽全高的GPU计算卡。该产品运用CPU+GPU协同计算架构，提供单台高达每秒数十万亿次计算能力，专为深度学习、人工智能、生命科学、医学、工程、金融建模、电子自动化等行业的专业人士设计，同时优化的系统散热方案不仅保证了整机运作的可靠性，提供给用户一个高性能、高稳定的超算平台。

（2U，机架式，支持第二代英特尔®至强®可扩展处理器，1600W（1+1）铂金冗余电源，支持8硬盘数量，支持4片双宽全高的GPU计算卡）

景派R22FG是一款2U双路机架式的GPU加速计算服务器，运用CPU+GPU协同计算架构，提供单台高度每秒数十万亿次计算能力。景派R22FG以第2代英特尔® Xeon® 可扩展平台为基础，提供出色的 2U 服务器效能，可在小空间中蕴藏强大的能力。其采用英特尔 Deep Learning Boost 技术以增强深度学习能力，景派R22FG在 ResNet-50 和 SSD VGG-16 模型上实现约 3.1 倍的性能提升，展现了新平台的推理能力。

系统配置参数如下：

骨灰级：景派R24FG（4U双路GPU加速计算服务器）

景派R24FG是景派科技推出的4U双路机架式GPU加速计算服务器，它采用Intel C622高性能芯片组，支持Scalable系列处理器和八片双宽全高的GPU计算卡。该产品运用CPU+GPU协同计算架构，提供单台高达每秒数十万亿次计算能力，专为深度学习、人工智能、生命科学、医学、工程、金融建模、电子自动化等行业的专业人士设计，同时优化的系统散热方案不仅保证了整机运作的可靠性，提供给用户一个高性能、高稳定的超算平台。

（4U，机架式，支持第二代英特尔®至强®可扩展处理器，1600W（2+1）铂金认证冗余电源，支持8硬盘数量，支持4片双宽全高的GPU计算卡）

景派R24FG具备强大的 GPU 架构，可在 4U 机箱中可支持8张高效能 NVIDIA Quadro 或 Tesla GPU 卡。藉由如此强大的图形能力，景派R24FG 让您以更快的速度和更高的效率完成高强度运算工作。优化内部配置使得景派R24FG可容纳各式各样的显卡，包含双槽 GPU，并搭载主动或被动散热模块。是一款2U双路机架式的GPU加速计算服务器，运用CPU+GPU协同计算架构。

系统配置参数如下：

以上就是景派科技在深度学习领域应用的“四件宝”，如果再提高等级，可以通过搭建GPU高性能计算集群来满足需求，也就是我们的

深度学习解决方案

景派科技丨超算丨HPC

景派资讯丨GPU计算平台---深度学习打工人的标配

深度学习的打工人都在哪些领域？

GPU深度学习性能对比测试

关于景派

HPC解决方案

高性能计算平台

软件与服务

关注我们

在线留言