在鲲鹏920亮相后,媒体赞美之词不绝于耳,不过,一些报道是值得商榷的。
有文章声称,鲲鹏920把计算带入多核异构的多样性时代。但是异构计算早就不是什么新鲜事物,在超算上,特别是TOP500排名靠前的超算上,大多都是异构计算,即便是服务器CPU,Intel在收购阿尔特拉之后,也拿出了CPU+FPGA的异构计算产品。相比之下,华为鲲鹏920只是一款非常传统的ARM服务器CPU,没有实现片上异构。
铁流猜测,文章声称鲲鹏920把计算带入多核异构的多样性时代,估计想表示鲲鹏920的一些接口能够支持CPU+GPU,CPU+NPU,只不过文宣想表达的鸡血一点,然后宣称过头了。
还有鼓吹鲲龙920性能的,但是标杆的选择有些问题,原文是:
典型主频下,SPECint Benchmark评分超过930,超出业界标杆25%。同时,能效比优于业界标杆30%,此前的纪录保持者是富士通的7纳米A64X,每个芯片最高可达每秒2.7万亿次浮点运算(2.7 teraflops)。
首先,SPEC测试和浮点运算次数根本不是一回事。科学运算看重双精浮点性能,而对PC和服务器而言,SPEC测试更具借鉴意义。像一些专门针对科学运算的CPU,会出现浮点运算性能牛逼,但SPEC测试成绩很一般的情况,最典型的例子就是龙芯3B1500。
其次,是对比的参数有问题,文章在把富士通的ARM芯片做对比时,举的例子是富士通ARM芯片的浮点性能,而拿鲲龙920的数据是,用的是定点性能,然后把富士通ARM芯片的浮点性能作为鲲龙920定点性能的标杆......
最后,富士通的那款ARM芯片和鲲龙920应用场景完全不同。富士通那款ARM芯片是超算芯片,计划应用于日本的E级超算,设计思路是类似SW26010的片上微异构的众核方案。而华为的鲲龙920就是服务器CPU,两款芯片根本不是一路货,根本谈不上谁是谁的标杆。
另外,还有把鲲龙920与5G,以及万物感知、万物互联、万物智能等概念进行关联的修辞方式。诚然,5G正当风口,万物感知、万物互联、万物智能看起来高大上,绑在一起可以大幅增加“逼格”。
只不过,5G其实是商业概念,根本不是技术迭代,全球通信厂商把一大堆零增益、负增益的技术塞进5G标准,整个系统效率基本没有提升,完全靠建设5倍的基站和消耗20倍的带宽提升网速,而且蓝图里的URLLC场景现在的5G技术根本实现不了,mMTC场景2G、4G都能做,把5G和万物互联进行捆绑完全是谎言。
另外,万物感知相关联的是传感器,万物智能相关的是AI芯片,万物互联关联的是各类通信芯片,铁流实在看不出来,一款服务器CPU怎么和万物感知、万物互联、万物智能绑在一起的。
相关背景报道:华为震撼发布新一代芯片鲲鹏,将成麒麟后另一关键自有技术生态
在许多中国神话中,能与麒麟这种神兽相提并论的并不多,而鲲鹏恰巧是其中最具标志性的一种。
道家学说《庄子·逍遥游》。书中记载“北冥有鱼,其名曰鲲。鲲之大,不知其几千里也;化而为鸟,其名为鹏。鹏之背,不知其几千里也。怒而飞,其翼若垂天之云。”常用鲲鹏比喻一些宏伟之事,一句俗语曰:“学做鲲鹏飞万里,不做燕雀恋子巢”。
而鲲鹏也成为继麒麟之后,另一个远大的产品与技术布局。
徐文伟强调,在计算趋势上,从终端搜集到的庞大数据,虽然有所谓的边缘计算可以分担,但要放到云端计算上,仍是现在云计算基础设施的沉重负担,要如何解决庞大数据流以及存储,和即时计算的需求,成为各家云服务器厂商积极寻求突破的关键。徐文伟指出,通过与 ARM 的合作,通过极大规模的核心整合,很好的解决了大数据的即时处理计算。
而配合在去年全连接大会中发布的升腾架构,以及在手机等边缘计算加入的 NPU 计算能力,华为构成了强大的生态优势,同时徐文伟也强调,华为并不会走封闭的道路,也会与英特尔等伙伴持续进行合作。
当然,与业界合作伙伴会持续,但为了摆脱依赖,增加自主能力也是华为一贯以来的发展重点,徐文伟讲到这边,手上拿出其最新的服务器芯片,也正是今天的主角:鲲鹏服务器芯片鲲鹏 920。
鲲鹏 920 集成了 64 个核心,频率为 2.6 GHz。该芯片组集成了 8 通道 DDR4,内存带宽超过现有产品的 46%。通过两个 100G RoCE 端口,系统集成也显着增加。Kunpeng 920 支持 PCIe 4.0 和 CCIX 接口,总带宽为 640 Gbps。此外,单槽速度是现有产品的两倍,有效地提高了存储和各种加速器的性能。
而另一个值得一提的是,鲲鹏芯片中集成了传统计算芯片的四大结构,包含网络、存储、主控芯片以及 CPU 于单一封装当中。
鲲鹏芯片也整合了 8 通道的内存控制器,提供较过去架构更高的整体带宽输出表现,增加幅度达到 48% 以上,这对于带宽要求以及即时计算能力要求极高的计算环境而言,可带来极大的帮助。
鲲鹏 920 是业界性能最高的基于 ARM 的服务器 CPU。采用最先进的 7nm 工艺, CPU 由华为独立设计,基于 ARMv8 架构授权。它通过优化分支预测算法,增加 OP 单元数量和改进内存子系统架构,显著提高了处理器性能。在典型时钟速度下,昆腾 920 CPU 在 SPECint 基准测试中得分超过 930,比行业基准高出 25%。与此同时,电力效率比行业同行提高 30%。 鲲鹏 920 为数据中心提供了更高的计算性能,同时降低了功耗。
华为在创新方面的持续精进,也反映到服务器产品方面的重要表现,不只性能拥有优势,其服务器产品出货总量已经达到 356 万部,俨然已经成为华为的另一大支柱。
安谋科技中国执行董事暨 CEO 吴雄昂则是强调了 ARM 生态所拥有的强大计算生态,可帮助华为在云计算上更好的发挥。。
华为智能计算业务部总裁邱隆则是上台宣布了 TaiShan 服务器产品线,基于鲲鹏芯片,而他也强调,这些服务器都是针对海量存储与数据计算工作而设计,所有的生态都是基于原生的 ARM 生态研发,包含软硬件的适配等,由于原生应用才能够发挥硬件的最大效能,华为也强调,在推出 TaiShan 之前,就已经进行投入软件开发环境的完备,而这一切的努力,都是要让客户能够体验到最佳的效能表现。
而不只是应用的原生与调优,邱隆也强调,在其服务器设计方面提供了更有效序的存储方式,以及更好的动态管理机制,让各种计算场景都能够获得更好的效果,同时也要降低管理成本。
邱隆同时也公布了华为云计算将使用基于鲲鹏的 TaiShan 服务器,并提供相较于对手达到 3 倍以上的整体输出效能表现。而云手机服务也同时开通,提供在云上直接运行 App 的能力。
华为也邀请了几大关键合作伙伴共同畅谈基于 ARM 生态的创新计算。
华为在硬件,基础软件和应用方面不断推进行业合作。华为一直与绿色计算联盟(GCC),Linaro,Open Edge 和 HPC Initiative(OEHI)等行业组织合作,与 Hortonworks,Microsoft,SAP,SUSE,Ubuntu 等合作伙伴一起构建开放,协作的行业生态系统。和中国标准软件。
在硬件方面,华为是 Linaro 的核心成员。在基础软件方面,华为是 OpenStack Foundation 的白金会员,也是云原生计算基金会(CNCF)的创始成员。在应用方面,华为已加入海湾合作委员会。GCC 发布了绿色计算联盟服务器技术标准报告,以及其他建立绿色开源计算社区的努力。华为也是 OEHI 的成员。
布局已久的智能计算技术
其实早在去年的智能计算大会中,华为宣布从 2018 年 12 月 21 日起,其服务器将全面升级为华为智能计算。作为华为基于联接、计算和云的三大使命,智能计算的重要性不言而喻。在当天的华为智能计算大会上,华为的智能计算业务新战略旨在解决行业智能化面临的 4 大问题,即算力供应、数据协同、场景部署、专业技术。针对这几个问题,华为智能计算业务将围绕算力、工程、云边协同和一体化解决方案四个方面进行,团队也在会上展示了其所做的努力。
为会上宣布的几大亮点是,将其 FusionServer 升级为 FusionServer pro,将数据中心升级为智能数据中心;2019 年还将诞生华为的第一颗 AI 管理芯片,可做到整个设备管理故障的自动预测。
当天虽然已经有提到 64 核 ARM 架构处理器鲲鹏芯片,但今天带着更多细节以及生态支持现身,正代表了华为在积极推动整体计算产业的革新,并且在拥抱业界合作伙伴的同时,也积极推动自有架构的研发,这代表著与世界接轨,但同时拥有核心技术的两大诉求,对于现在的中国产业而言,其实是值得借鉴的一点。
云计算竞争激烈,拥有生态才有话语权
随着中国的云计算市场快速扩张,竞争正在变得愈发激烈,其中,在公有云领域已经具备领先地位的是有着优质互联网基因的阿里、腾讯。阿里云占据国内半壁江山,规模效应优势明显,而腾讯云则围绕游戏、视频业务优势实现游戏云、视频云的领先,2018Q1 腾讯其他服务(包括支付解决方案业务、相关金融服务以及云服务业务)同比增长 111%,其中云业务增速超过 100%。
以华为为首的传统 IT 企业的进攻也不容忽视。
在刚刚过去的 2018 年,华为在 10 月举行的全联接大会上放出“大招”,一口气发布了多款 AI 芯片——昇腾 910 和昇腾 310 两款自研 AI 芯片,成为华为智能计算架构的核心。
其中,昇腾 910 采用 7nm 工艺制程,半精度达到 256T,据称是全球单算力最高的 AI 芯片,计算力远超谷歌及英伟达。而昇腾 310 则采用 12nm 工艺制程,最大功耗仅 8W,整数精度能达到 16T,主打极致高效计算低功耗 AI 芯片。当时,华为徐直军还给出了这两款 AI 芯片的上市时间——2019 年第二季度。而在 2019 年,华为还将推出 3 款 AI 芯片,均属昇腾系列,同时华为将会基于昇腾系列 AI 芯片提供 AI 云服务。
需要特别强调的是,昇腾 910 和昇腾 310 两款自研 AI 芯片使用华为自研的达芬奇架构,使用了华为自研的高效灵活 CISC 指令集,每个 AI 核心可以在 1 个周期内完成 4096 次 MAC 计算,集成了张量、矢量、标量等多种运算单元,支持多种混合精度计算,支持训练及推理两种场景的数据精度运算。
在华为之前,百度、阿里巴巴都已经先后宣布自有 AI 芯片的布局,百度的昆仑芯片使用自行设计的架构,虽然芯片还在设计阶段,但该公司宣称其理论算力要高出 NVIDIA 的方案一倍以上。
阿里巴巴则是宣布将投入 Ali-NPU 神经网络芯片的研发,该架构不提绝对性能,而是强调其超高性价比,号称超越传统 CPU/GPU 架构达 40 倍。腾讯虽然还没有宣布其自有 AI 芯片的布局,但其之前曾投资 VoxelCloud(体素科技)、碳云智能、真时科技以及蔚来汽车等企业,发展方向以 AI 的行业应用为主,与其他公司不同。
而这次发布的鲲鹏芯片,背后的 ARM 生态布局,不仅补足了华为在服务器与云计算业务中关于自有通用计算架构的重要一块,更确保了华为从云到端都能拥有自己的核心竞争优势,麒麟与鲲鹏这两大神兽,往后将持续成为推动华为生态继续前进的最大动力。
云计算已经华为下一个经营重点,两大神兽从端到云分头并进
华为从 2008 年开始云计算研发,2010 年正式发布华为云计算战略及端到端的解决方案,到 2015 年 7 月 30 日发布针对中国市场的企业云服务,积极探索开发、运营、运维一体化模式,与合作伙伴共同打造‘开放、协同、供应’ 的云合作生态圈。
在 2017 年,此前属于 P&S(产品与解决方案)部门的 Cloud BU 迁移至华为集团下,成为华为继运营商 BG、企业 BG 和终端 BG 之后的第四大业务单元,释放出华为在发展云计算上的重大决心。同样是在这一年,华为宣布了进军公有云,并表示自己的优势是可以提供“云、边、端、联接”整体解决方案。
2018 年 7 月,华为云公布一些列核心“成绩单”。根据官方公布的数据,仅在 2018 年上半年,华为云的合作伙伴增长 45%,收入同比增长 700%,云市场新增上架应用 872 个,软件开发服务 DevCloud 拥有 9 万名开发者。
在人工智能领域,华为云推出 EI 智能体,发布深度学习、图像搜索、EI 智能视频等系列服务,推动 AI 在行业应用场景落地;在计算领域,全新推出网络增强型云服务器 C3ne,使云计算进入千万级网络转发时代 ;在云安全方面,在国内首家全平台、全业务、全节点通过 PCI-DSS 安全认证,高分通过公安部网络安全等级保护 4 级测评。
华为云能取得以上成绩,从硬件、软件到解决方案,华为云长期的技术积累让它具备后发优势。
华为过去一直以来都以麒麟神兽称霸行动与边缘计算产业,去年全年智能手机出货已经超过 2 亿支,麒麟更是其中高端产品的重要核心,而今年鲲鹏加入华为的神兽行列,成为推动服务器计算生态的重要核心,更代表华为积极布局更多业务机会,且同时要掌握计算核心技术自有,并与世界同步,创造更广大的开放生态。