国产AI服务器的“变形金刚”曙光XMachine如何精炼“十八般武艺”,

在11月21日在苏州召开的英伟达GTC大会上,展位很有趣,很多制造商只摆放了一个展位,但是空荡荡的没有产品,却在中科展台上展示着实体产品,吸引了很多人的目光。这是新的XMachine系列的国产AI。

中科曙光这次发售的新XMachine系列AI服务器主要包括X745-G30、X785-G30、X795-G30、X740-H30这4个产品。基于Skylake,该系列AI服务器最多可以支持8卡NVLink的GPU、10卡训练GPU、20卡推理加速卡。

它们采用统一的硬件平台,与合适的英伟达公司Tesla系列产品完全兼容,满足现在主流应用的需要。采用CPU和GPU的背平面解联设计,能够根据CPU和GPU的发展分别独立升级,能够降低用户的更新世代交替成本。

中科曙光根据智能计算技术总监许涛,像X740这样的产品适合推理,可以支持4个T4英伟达的云卡GPU,但是X745、X785、X795的产品适合训练,有很多兼具推理功能的应用场景。另外,X745与X785、X795不同,X745在考虑四块GPU卡服务器的同时,也考虑高性能计算AI支持服务器。

“进行网络设计时,CPU到GPU的带宽完全连接,不会被阻塞。这样就可以满足高性能计算带宽的需求。”许涛。

更重要的是,XMachine系列AI服务器可以实现一个硬件平台、两个不同的母板CPU、GPU,三个不同的拓扑可以实现更多种类、更强的适应性AI服务器的变化业界内被称为国产AI服务器中的“金刚”。

为什么被称为国产AI服务器的“变形金刚”呢。许涛解释:GPU服务器有很多规格,英伟达在该推荐中,像深学习那样的场景被分成推理和训练,不同的应用场景对GPU服务器的要求不同。训练需要耗电高、计算力强的大型卡GPU,推理需要像这次英伟达发表的T4那样的小型卡,消耗功率低。

“通过不同需求的驱动,可以在同一平台上满足不同的应用程序和不同的需求。”许涛介绍。

接着,英伟达现在的GPU卡片形式也变化,除去正大力普及NVLink。许涛表示:“在设计产品时,需要考虑PCl-e接口和NVLink接口如何协作。基于这两个方面,在设计服务器时,尽可能地在一个平台上考虑这些需求。”。

另外,XMachine系列AI和GPU板被分离设计,2个板可以以独自的进化速度前进。这个模块化组合的优点是产品的零件交换方便、灵活、简单。

“当前GPU的设计不同,GPU基板的设计也不同,从母板到GPU板的连接设计也不同。在长期计划中,至少需要两个不同的母板、三个不同的基板、三个不同的连接拓扑,计算18种不同的机型。”许涛)“从内部来看,这样的产品可以像变形金刚那样,通过不同的组合来满足不同客户、不同业务的需要”。

理论上有18种组合和组合,但实际出货时,中科曙光会根据客户的需求,向用户提出具体的确切解决方案。

除了硬件的推荐外,“也有解决方案团队。我想向用户提供完整的解决方案。我从他们的应用程序中推荐适合客户的硬件结构。”许涛补充。

XMachine的第一代产品可以追溯到2016年。2016年,中科曙光最初的GPU作为服务器的产品发售了。

与以往的服务器不同,现在的GPU服务器或人工智能服务器在设计时会出现两个大问题。第一,耗电非常大。“现在设计的服务器的最大耗电达到3200W,这只不过是额定功率。英伟达HGX的下一代产品的基准电力是10千瓦。因此,耗电对于GPU或AI服务器来说是非常大的课题。”表示许涛。

因为耗电大,所以会产生散热压力非常大的新问题。

第二,成本高。GPU服务器的单个成本非常高,GPU成本高,一台GPU服务器的成本接近百万。这样一来,服务器稳定性的要求会变高。

许涛强调“一个是供电和散热,一个是稳定性的考虑,这些必须从设计开始考虑”。

那么,曙光新XMachine系列的国产AI服务器是如何解决上述问题的呢。

对于电力供应和散热的问题,曙光AI服务器基于集成平台,整体GPU仓具有3U的高度。这样,散热空间就会变得非常大。在许涛中,由于柜的消耗功率不会无限大,所以能够放在一个柜中GPU服务器非常有限。在这样的条件下,GPU服务器的空间不需要压缩到极限,对散热造成非常大的压力。

许涛表示,“综合考虑,4U的高度非常合理,与顾客对空间的需求兼容,GPU能够对高耗电的加速器进行散热,为将来留下了很大的空间。”。

现在,人工智能市场正在加速发展,随着时间的推移,人们的期待也越来越高。今后5年,人工智能可以保持高速发展,GPU对服务器和高计算力服务器的需求非常强烈。

考虑到这样的市场机会,曙光新的AI服务器被及时发售了。许涛希望曙光在后续市场成长中积极响应市场需求,将市场需求转化为我们的产品,更好地配合市场,推动公司的成长。

VPS推荐

优劣的判别高防服务器,租用高防云服务器

2022-5-5 22:24:00

VPS推荐

优炫软件会长梁继良获得“2022数据库阅读器”,

2022-5-5 22:24:06

搜索