国内的半导体技术到底是什么水平?
这个问题想必很多国人都感兴趣,其实感兴趣的不只国人,老外也十分关注中国的半导体行业发展,而在小雷日常逛外国科技数码网站的时候,就看到了一篇关于中国半导体芯片的报道。
标题十分吸引人:《Loongson Claims its CPU IPC Will Match AMD Zen 3 and Intel Willow Cove by 2023》,翻译一下就是:龙芯称其CPU的IPC性能将在2023年之前与AMD Zen3及英特尔Willow Cove(十一代酷睿的架构)匹敌。
说实话,粗看标题小雷第一反应是今天是不是愚人节,显然不是,毕竟五一假期都过去一个多月了。
对半导体、芯片领域不熟悉的读者可能没什么感觉,但是只要对这两个领域有一定了解,都会感到震惊,毕竟Zen3和Willow Cove可是实打实的先进制程+先进架构,代表着目前世界上半导体行业的最高水准。
不说对标Zen3和Willow Cove,只要龙芯能够达到Zen1的水平,都足以让我们在半导体领域扬眉吐气,直接与AMD、英特尔叫板。理智告诉我虽然国内半导体行业发展已经十分迅速,但是想要在如此短的时间内追上世界先进水平,可能性还是太低了。
到底是什么东西,能让老外们给出这样的报道??
龙芯大战Zen3?
在外网的文章报道中,龙芯公司声称将在2023年推出在IPC性能上能够与AMD Zen3匹敌的处理器。首先我们了解一下什么是IPC性能,简单来说,IPC就是CPU每一时钟周期内执行的指令数量,假设时钟周期为1,上一代的CPU可以在1的时钟周期内执行100条指令,下一代提升为115条,那么就等于IPC性能提升15%。
而且,英特尔提出的CPU性能判断公式就是CPU性能=IPC*主频,所以在主频不变的情况下,对比IPC性能就可以得出CPU性能的提升幅度。举个例子,同样是3.0GHz主频,A型CPU的IPC性能为100,B型CPU性能为150,那么B型CPU的性能就比A型CPU高50%。
当然,CPU的真实性能涉及到更复杂的变量,比如系统、应用环境等,只是单纯从数据方面来说,如此计算也是对的。所以,IPC性能指标十分重要,甚至可以说IPC性能的提升基本上就等同于CPU性能的提升。
那么龙芯下一代处理器3A6000的IPC能够与Zen3媲美,说明3A6000在性能上能够媲美Zen3?并不是,IPC性能是一个重要的指标,但是CPU主频一样重要,只要其中一项数据无法并驾齐驱,真实性能就不可能相等。
AMD的Zen3处理器目前最低端的入门型号为Ryzen3 5400U,四核八线程,基准主频为2.6GHz,最大加速时钟频率为4.0GHz。作为对比,龙芯3A5000的主频为2.3GHz-2.5GHz(目前龙芯主频最高的在售处理器),主频的巨大差距意味着即使两者的IPC性能相当,3A5000的最高性能也不如Ryzen3 5400U的正常最低性能。
即使乐观预计下一代的3A6000能够提升主频,大概率也不会超过2.8GHz,0.3GHz的提升看似很小,但是了解处理器领域的读者应该清楚,0.3GHz的变化基本上等同AMD Zen2到Zen3的提升幅度,难度其实非常大。
当然,就算真实性能无法与Zen3媲美,光是IPC性能相当就足以让人感到兴奋。不过我在龙芯官网却没有看到相关的报道,仅仅是看到:龙芯3A6000及龙芯3C6000系列将采用12nm工艺和新的LA664架构设计。
另外,龙芯基于新架构和工艺做的仿真测试结果显示:龙芯3A6000处理器单核SPEC CPU 2006定点/浮点base分值从26/28分提高到35/45分,分别提升37%及68%。以上就是官方公布的关于3A6000系列处理器性能的消息,并没有提到IPC性能,那么IPC性能的数据又来源于哪里呢?
(图片来源:龙芯官网)
经过检索,在网友的指路下我发现IPC性能的相关报道来自于一个自媒体,作者通过整合前两代龙芯的性能测试结果,基于龙芯给出的3A6000模拟数据计算出了SPEC06单核定点Base和浮点Base的成绩。最后假设3A6000的主频达到2.5GHz-2.8GHz,那么3A6000的IPC性能就将与Zen3相仿。
简单来说,这个结果是基于假设的模仿测试得出的,暂时还没有实际的数据支撑,所以国产CPU的支持者还是别高兴得太早了。
龙芯现状如何?
龙芯现在到底走到了哪里?近日举办的“2022年LoongArch生态发展暨通明湖创新应用论坛”也许可以给出答案。LoongArch可能听过的人并不多,不过另一个名字大家应该都熟悉——龙芯,LoongArch正是龙芯中科研发的一个指令集架构,目前主要应用在旗下的龙芯系列芯片中。
(图片来源:龙芯官网)
在论坛上,龙芯中科正式发布3C5000系列芯片,所采用的就是上面提到的LoonArch指令集架构,根据官方说法,3C5000系列芯片可以满足通用计算、大型数据中心和云计算中心的使用需求。
(图片来源:龙芯官网)
虽然国内半导体行业在过去发生过不少让人难以启齿的问题,但是作为国内自研半导体芯片的龙头,龙芯确实无愧于他们的名字。3C5000系列的官方数据显示,其采用16核心设计,unixbench分数达到95000分以上,双精度计算能力可达560GFlops,峰值性能与典型ARM 64核处理器相当。
此外,3C5000系列最高支持16路互连,搭配一并推出的龙芯7A2000桥接芯片,使PCIe带宽对比上一代芯片提升达400%以上。从描述来看,3C5000系列确实拥有不错的性能,那么具体性能如何呢?
具体参数方面,3C5000L的主频为2.0GHz-2.2GHz,支持4个72位DDR4-3200控制器,支持ECC校验,支持1个SPI、1个UART、3个I2C、16个GPIO接口,功耗为130W。
(图片来源:龙芯官网)
虽然3C5000L看起来并不算出彩,但是在国产处理器中却是数一数二的存在,进步的速度也远比预料的快。而且,LoongArch也已经摆脱了MIPS的束缚,根据相关信息来看,LoongArch是完全自主研发的新型架构,仅通过二进制翻译技术兼容MIPS。
甚至可以说,如今束缚国产芯片的主要因素其实只剩下制程工艺和光刻机,而在芯片设计上国产芯片已经迸发出让人惊叹的实力,在稳步前进的情况下,只要能够解决光刻机等问题,那么在未来的10年左右追上领先水平并非没有可能。
有读者可能觉得10年也太久了吧?实际上,能够用30年追上英特尔、AMD六七十年的研发成果,已经足以让人感叹我们在半导体领域的进步神速了。