面向数据中心和专业领域的图形处理单元(GPU)要比面向个人“游戏党”的大得多,目前NVIDIA最大的一款是HGX-2
每个GPU有32GB显存,16个GPU总共512GB
两张基板共16个Tesla V100,使用的GV100芯片与TITAN V相同,两张基板间任意两个GPU都可以通过6xNVLINK互联(两张基板之间总共有48xNVLINK)
虽然每个GPU都有PCIe x16接口,但NVIDIA的配置建议是使用两层PCIe Switch配置,提供4个PCIe x 16电缆,连接到双插槽的CPU节点上。
价格是$399,000美元
当然我认为这只是商品化的极限,因为对于大多数客户来说,DGX-2已经足够强也足够贵了,那么工程的极限在哪里呢?我想我们可以先看看计算机图形学历史上的“怪兽”SGI。
SGI Onyx 2,曾经是90年代中后期“地表最强图形机器”,盒子里面大概是这样,DG是“显示发生器 - Display Generator”,RM是光栅管理器“Raster Manager”,GE则是“几何引擎 - Geometry Engine”这三个部分组成了现代图形卡的基本功能。
而上面的那个版本只是最小,而且最“温柔”的版本,由于SGI的“现实引擎 - RealityEngine”是高度模块化的,因此用户可以根据自己的需要组合自己的图形管线,并在机架式的系统里组建自己的“图形砖块 - G Brick”
一阶怪兽,包括多个GE、DG和RM/TM(Raster Manager/Texture Memory,光栅管理器/纹理内存)
二阶怪兽,四个图形模块和两个处理器模块
大概就是这个样子的
给大家展示SGI在90~2000年代的成果,是要带大家看一看一个更大的计算机系统里的图形处理部分,是如何搭建起来的。
当GPU之间的距离跨越多个电路板甚至多个机架的时候,瓶颈就不在硅芯片的内部,而在电路板之间的互联互通,当年的SGI Onyx 2可以在一个系统里支持16条图形管线已经算得上是工程奇迹,而今天的NVIDIA搭建的DGX SuperPod可能是当下的“地表最强图形系统”,使用了96个DGX-2H(2H包括DGX-2和支持性的Intel X86处理器部分),1536个Tesla V100,49TB GPU可以直接访问的“显存”和144TB连接到CPU上的内存,除了不能给游戏党打单机,它可以被使用在几乎所有需要GPU解决的问题上:数据可视化、深度学习、数字内容制作、大规模图像处理、科学计算等等。这大概就是NVIDIA能搭建的“最大显卡”吧。