C114讯 9月19日午间消息(蒋均牧)紧随第一天的全球最快AI训练集群Atlas 900,华为在其年度全联接大会(HC 2019)上再发两款基于昇腾910处理器的“最强”产品。
其一是业界最强AI训练卡Atlas 300,可提供256 TFLOPS的算力,是当前业界主流训练卡的2倍,每秒训练的图片数量从965张提升到1802张。它支持100G RoCE直出高速接口,可实现梯度参数和数据集并行传输,最高可降低70%的梯度同步时延,支撑集群训练时间缩短到秒级。
其二是业界最强AI训练服务器Atlas 800,4U空间集成了8颗昇腾910 AI处理器,可提供2 PFLOPS的超强算力,算力密度是业界同类产品的2.5倍。Atlas 800仅重75千克,重量不到业界同类产品的一半,内置32个硬件解码器,每秒可完成16384张1080P图片解码,是业界主流产品处理能力的25倍,而且可以与训练并行处理。它还支持风冷和液冷散热,可满足企业数据中心和集群高密部署两类场景,单机能效比为业界同类产品的1.8倍。在华为松山湖的数据中心中已经部署了采用全液冷散热的Atlas 800,单机柜的散热能力高达5万瓦。实际上Atlas 900就是基于Atlas 800组建的。
华为现已完成了Atlas全系列产品布局,覆盖云、边、端全场景,面向训练和推理提供强劲算力。基于统一的达芬奇架构和全场景AI计算框架,可实现云边端协同,加速全行业的智能化再造,华为公司高级副总裁、Cloud&AI产品与服务总裁侯金龙表示。
另据C114了解,华为8月23日正式发布了算力最强的昇腾910。这款芯片基于达芬奇架构,半精度(FP16)算力达到256 Tera-FLOPS、整数精度(INT8)算力达到512 Tera-OPS,达到规格算力所需功耗仅310W、明显低于设计规格的350W;在典型的ResNet50网络的训练中,昇腾910与MindSpore配合,与现有主流训练单卡配合TensorFlow相比显示出接近2倍的性能提升。