C114通信网  |  通信人家园

资讯
2019/9/19 12:37

基于昇腾910:华为再发两款业界最强AI产品

C114通信网  蒋均牧

C114讯 9月19日午间消息(蒋均牧)紧随第一天的全球最快AI训练集群Atlas 900,华为在其年度全联接大会(HC 2019)上再发两款基于昇腾910处理器的“最强”产品。

其一是业界最强AI训练卡Atlas 300,可提供256 TFLOPS的算力,是当前业界主流训练卡的2倍,每秒训练的图片数量从965张提升到1802张。它支持100G RoCE直出高速接口,可实现梯度参数和数据集并行传输,最高可降低70%的梯度同步时延,支撑集群训练时间缩短到秒级。

其二是业界最强AI训练服务器Atlas 800,4U空间集成了8颗昇腾910 AI处理器,可提供2 PFLOPS的超强算力,算力密度是业界同类产品的2.5倍。Atlas 800仅重75千克,重量不到业界同类产品的一半,内置32个硬件解码器,每秒可完成16384张1080P图片解码,是业界主流产品处理能力的25倍,而且可以与训练并行处理。它还支持风冷和液冷散热,可满足企业数据中心和集群高密部署两类场景,单机能效比为业界同类产品的1.8倍。在华为松山湖的数据中心中已经部署了采用全液冷散热的Atlas 800,单机柜的散热能力高达5万瓦。实际上Atlas 900就是基于Atlas 800组建的。

华为现已完成了Atlas全系列产品布局,覆盖云、边、端全场景,面向训练和推理提供强劲算力。基于统一的达芬奇架构和全场景AI计算框架,可实现云边端协同,加速全行业的智能化再造,华为公司高级副总裁、Cloud&AI产品与服务总裁侯金龙表示。

另据C114了解,华为8月23日正式发布了算力最强的昇腾910。这款芯片基于达芬奇架构,半精度(FP16)算力达到256 Tera-FLOPS、整数精度(INT8)算力达到512 Tera-OPS,达到规格算力所需功耗仅310W、明显低于设计规格的350W;在典型的ResNet50网络的训练中,昇腾910与MindSpore配合,与现有主流训练单卡配合TensorFlow相比显示出接近2倍的性能提升。

给作者点赞
0 VS 0
写得不太好

版权说明:C114刊载的内容,凡注明来源为“C114通信网”或“C114原创”皆属C114版权所有,未经允许禁止转载、摘编,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。编译类文章仅出于传递更多信息之目的,不代表证实其描述或赞同其观点;翻译质量问题请指正

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2024 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141