C114通信网  |  通信人家园

资讯
2019/1/11 11:33

详解:鲲鹏920因何诞生?强在哪里?

C114通信网  蒋均牧

C114讯 1月11日专稿(蒋均牧)继麒麟、巴龙、昇腾后,华为近日推出了业界最高性能ARM架构处理器鲲鹏920(Kunpeng 920),以及基于鲲鹏920的泰山(TaiShan)服务器、华为云服务,进一步扩展其自主芯片阵营。这款7nm工艺芯片亦是其首款基于ARM架构的服务器CPU,面向智能时代到来打通从端到云的ARM价值链。

可以说鲲鹏920的出现再次印证了华为强大的创新实力及技术底蕴,那么其诞生背后又有着怎样的洞察和逻辑?华为董事、战略Marketing总裁徐文伟指出,业务与数据的多样性驱动了计算的多样性,ARM产业迎来了新的发展机会,华为期待与产业伙伴紧密合作,共同开创一个多样性的计算时代。

据介绍,鲲鹏920及TaiShan服务器将主要应用于大数据、分布式存储、ARM原生应用等场景。同时他亦强调,华为与英特尔的合作取得了很好的成绩,为ICT产业发展作出积极贡献,双方也将长期保持战略合作、聚焦价值持续创新。

鲲鹏920因何诞生?

任何一个新事物的出现都脱离不了时代大背景,鲲鹏920的诞生同样如此。首先,业务和数据的多样性需要新的计算架构。智能时代的信息量巨大,计算无处不在,计算应用的场景多种多样,从扫地机器人,到大家熟知的智能手机、智慧家庭、IoT物联网、智能驾驶等。场景的多样性,带来数据的多样性,数字、文本、图片、视频、图像以及结构化数据、非结构化数据等。

“业务与数据的多样性,驱动计算的多样性,这是必然的趋势。没有一个单一的计算架构能够满足所有场景、所有数据类型的处理,我们看到各种CPU、DSP、GPU、AI芯片、FPGA等同时存在,多种计算架构共存的异构计算,是未来的发展之路。”徐文伟说。

其次,海量的数据增长,带来了更高的计算需求。华为GIV2025预测,到2025年新增数据量180ZB,是2018年新增数据量的18倍,面对如此巨大的数据增长,对计算和存储都提出了很高的要求。算力供应问题,存在严重的供需不平衡,特别是随着人工智能走向成熟增长期——根据OpenAI发布的《AI与计算》报告,自2012年以来,人们对于算力的需求增长了超过30万倍,其目前速度为每3.5个月翻一倍,每年增长约10倍,这将驱动一个指数级增长的巨大计算空间。

英特尔通过摩尔定律和x86在过去数十年中将计算由专用带向了通用,开创了个人PC时代,随着大量数据中心的出现,英特尔自然而然地进入了服务器领域并向边缘计算领域拓展。ARM则始于低功耗、计算量小的场景,诸如智能手机、可穿戴、IoT等领域,随着技术不断进步、多核性能大幅提高,尤其是得益于开放的生态,ARM也从端和边缘计算走向了服务器和数据中心:“当下,ARM架构发挥在多核、低功耗等方面的优势,在面向大数据、分布式存储和ARM原生应用等场景,为企业构建高性能、低功耗的新计算平台,这也是计算发展的必然趋势。”

此外,华为发布鲲鹏920或许也有着展现强大创新实力以及对外部形势未雨绸缪的考量。这款芯片基于ARM架构授权(据C114了解华为拥有20年的ARM架构授权),由华为自主设计完成,为目前业界最高性能的ARM-Based CPU。而华为创始人、CEO任正非在2012年的一次内部讲话中即指出,“我们在做高端芯片的时候,我并没有反对你们买美国的高端芯片。我认为你们要尽可能的用他们的高端芯片,好好的理解它。只有他们不卖给我们的时候,我们的东西稍微差一点,也要凑合能用上去……主要是让别人允许我们用,而不是断了我们的粮食。断了我们粮食的时候,备份系统要能用得上。”

鲲鹏920强在哪里?

在徐文伟口中,鲲鹏920是一个里程碑,这不仅来自其开启多样性计算的产业性意义,亦在于其强大的表现。具体而言,这款处理器带来了高性能、高吞吐、高集成、高能效的创新突破,将计算推向了全新高度。

性能:鲲鹏920集成了64核、主频提升至2.6GHz,并通过优化分支预测算法、提升运算单元数量、改进内存子系统架构等一系列微架构设计,大幅提高了处理器核性能。典型主频下,单芯片SPECint Benchmark评测跑分超过930分,超出业界标杆25%,能效比也优于业界标杆30%——这意味着鲲鹏920能够以更低功耗为数据中心提供更强的性能。

吞吐:为改善在低延时条件下高并发的能力,  华为在鲲鹏920上采取了三项措施。首先将业界DDR通道数量从6通道增加到8通道,速率从2666MHz提升至2933MHz,总带宽达到1.5T比特每秒,超出业界主流内存带宽46%;其次将PCIe从3.0升级到4.0,速率翻番,带宽达到640Gbps,比业界主流提升66%;第三将网口带宽从25G直接提升到100G,带宽翻了4倍。

集成:传统服务器架构上,CPU/南桥/网卡/硬盘控制器是系统标配,需要4颗芯片来实现;随着workload的丰富多样、异构计算的不断兴起,在服务器层面需要更多的槽位来部署不同的业务加速部件,而槽位在服务器上是一个紧缺资源。而鲲鹏920不仅是一颗通用CPU,还同时集成了南桥、网卡、SAS存储控制器等三种芯片的功能,做到集成度业界第一,单颗芯片实现4颗芯片的功能,从而可以释放出更多槽位扩展更多功能,大幅提高系统的集成度并为客户带来总体拥有成本上的收益。

能效:云计算的兴起,使得数据中心规模越来越大,从几台服务器、几个机架演变成以万台服务器为单位的数据中心集群,占地空间和能源消耗成为大型数据中心的重要影响因素,节能具有更重要的意义。正因每个机架的供电能力是有限的,每个机架的计算能力越强,在大规模数据中心建设时越能有效减少总体占地和减少功耗。基于鲲鹏920,在大规模数据中心业务实践中,每万台服务器可每年省电1000万度、碳排放每年减少1万吨。

“由于用户需求的多样性,数据中心的应用越来越多样化。我们相信,伴随ARM生态的日益完善,在数据中心的传统应用上,鲲鹏920将有出色表现。同时,随着手机行业的不断发展,在云手机这样的新兴应用上鲲鹏920也将不断探索、积极创新,更好地满足客户需求。我们与业界伙伴一起,共同迈向多样化的计算时代。”徐文伟如是说道。

给作者点赞
0 VS 0
写得不太好

版权说明:C114刊载的内容,凡注明来源为“C114通信网”或“C114原创”皆属C114版权所有,未经允许禁止转载、摘编,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。编译类文章仅出于传递更多信息之目的,不代表证实其描述或赞同其观点;翻译质量问题请指正

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2024 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141