能打败黄大仙的或许只有他自己。
“今天,我们宣布Atlan不再是第一了……”皮衣教父黄仁勋在9月20日晚的GTC 2022上平静的宣布这个消息,他还有一个身份是英伟达创始人兼首席执行官。
黄仁勋的下半句是,“取代Atlan的将是Thor”,并表示其性能将是Atlan的两倍。
英伟达SOC算力示意图
Atlan是英伟达去年推出的一款5nm制程的1000TFLOPS算力的自动驾驶SOC芯片,原本计划2024年上市,随着Thor的面世,Atlan还没出生就成为历史。
1TFLOPS代表处理器一秒进行1万亿次浮点运算,这意味着Thor每秒将进行2000万亿次的运算。要知道,目前特斯拉的FSD(完全自动驾驶)自研芯片的算力为144 TOPS,Thor的算力约为前者的14倍。
GPU霸主英伟达,携算力优势杀入汽车芯片市场,正在对全行业降维打击。
面对英伟达的发起的算力军备竞赛,其它芯片厂商还有没有还手之力?
作为中国芯片产业与世界差距相对较小的领域,地平线、华为、黑芝麻等国产汽车芯片在大变局下又将何去何从?
汽车算力革命进行时
英伟达大搞算力竞赛的背后,是汽车芯片领域的一场巨大变革。
在传统汽车上,需要计算机自动控制的功能并不多。但是随着新能源时代开启,汽车对电子化的要求正在突飞猛进,从自动和辅助驾驶,到智能座舱,都需要强大的芯片控制。
可是芯片变多了,需要的电线也变多了,汽车变得像我们的电脑桌一样,乱糟糟的电源线看着都糟心。
车辆线束复杂度增加,还不只是糟心的问题,更是直接导致了更高的成本和更复杂的设计。特别是车辆智能化时代,各项功能的增加直接导致电子控制单元(ECU)数量的激增。
按照《自动驾驶车辆工程》杂志统计显示,高档轿车和全尺寸卡车可能使用了40种不同的线束,搭载了超过700个连接器和3000条电线。如果把汽车上的电线全部连起来,其长度可以超过4公里,重量将达到60公斤。
化繁为简、降低整车线束复杂度成为新需求。而减少线束最有效的方式,就是减少芯片数量。
在此背景下,零部件Tier1企业博世2016年最早提出域控制器的概念,将整车ECU整合为驾驶辅助、安全、车辆运动、娱乐信息、车身电子5个域,各自只需要一个域控制器,就可以替代过去大量的独立ECU。
特斯拉的做法更激进,直接按照车身域划分成前车身域、左车身域、右车身域三部分,实现整车控制。
根据中信证券近期拆解特斯拉model3的信息显示,前车身控制器包括ESP 车身稳定系统等安全相关、冷却液泵热管理相关、车头灯和雨刮等其他功能;左车身域控制的核心芯片控制和配电,包括左车身的灯具以及电机;右车身域负责空调、雷达、高位刹车灯和后机油泵等控制。
特斯拉域控制器示意图
汽车行业普遍认为,域控制器是汽车电子行业未来竞争门槛最高、利润最高的部分。想用一个域控制器,实现多个ECU的功能,最大的门槛当然是算力提升。
提到算力,英伟达可就不困了。
博世和特斯拉的域控制器模式也带动汽车产业迎来一次革新,黄仁勋想接过接力棒。对于自动驾驶而言,2000TFLOPS浮点算力已溢出,他的野心是将域控制器再集成。
黄仁勋在演讲中明确表示,Thor这颗SoC芯片就是为汽车的中央计算架构而生,用这一颗芯片打造一个控制器,即可同时为自动泊车、智能驾驶、车机、仪表盘、驾驶员监测等多个系统提供算力。“Thor支持计算域分隔开发,既能将2000TOPS全部用于自动驾驶工作流,也可以分配使用,将一部分用于智能座舱、AI娱乐,一部分用于辅助驾驶。”
言下之意,Thor不仅仅是Orin X自动驾驶芯片的升级版,同时还可以替代高通8155、8295等座舱芯片的工作。不只是要搅局智能驾驶芯片的市场,黄仁勋还要和竞争对手高通抢占座舱、娱乐芯片的份额。
汽车产业有一个共识,传统燃油车时代低算力MCU无法适应车辆智能化发展,汽车架构已由传统分布式架构转向域控制器,数量更少的大算力ECU替代庞杂的MCU,下一步是由域控制器转向中央式电子电气架构。英伟达正在引领汽车芯片的第二次革命。
据悉,Thor芯片将最先在极氪车型上量产交付,第一站就选择中国市场。
不只是黄仁勋,想引领第二次芯片革命的厂商并不少。德国零部件安波福今年9月表示,已推出全球首款整车中央计算平台CVC,将率先在中国市场运用,集成ADAS、车身功能、网关及VCU功能,可处理汽车中数百个组件的通信信号。新势力小鹏则是表示,新旗舰G9将采用“中央超算+区域控制”的融合硬件架构。
算力很好,但不是全部
英伟达算力霸权难以撼动,其它芯片厂商的出路在哪?
首先,尽管中央式电子电气架构是所有人的理想,但是现行的多个域控制器方案并非不可接受。通过多个低算力芯片的堆叠,来获得跟高算力类似的效果,是当下车企通行的做法。
目前,很多主机厂已经通过多芯片堆叠,将算力堆到1000TOPS级别。例如,今年陆续上市的新车蔚来ET7、ES7和威马M7,均搭载4颗7nm制程的英伟达orin芯片,算力达到1016TOPS。魏牌摩卡则是采用高通Snapdragon Ride自动驾驶平台推出的5nm制程的SA8540P+SA9000P芯片组合,算力达到1440TOPS。
更重要的是,绝对算力并不等价于最终的实车应用效果,很多低算力芯片的实际表现,未必输给高算力。
换句话说,高算力的确在面对更复杂的场景时响应速度。例如在车机系统领域,避免黑屏、宕机的窘境。但英伟达、高通、Mobileye提供的是通用智能驾驶平台,主机厂或者自动驾驶公司能否将芯片的算力发挥到100%?
美国辅助驾驶巨头Mobileye首席执行官Amnon Shashua就指出,TOPS是一个非常不充分的计算能力指标,效率比算力更重要。
国产芯片厂商地平线CEO余凯在反驳英伟达CEO的“TOPS就是新的马力”时直言,“百公里加速比马力更真实反映动力性能,每秒准确识别帧率MAPS比算力更能反映芯片的AI性能”。
对于英伟达亮相的Thor系统芯片,地平线相关人士告诉观察者网,“落地到量产应用层面,还是要关注车企的实际需求,车企的成本以及消费者的购买成本。我们还是更加强调效率,强调软硬结合。”
究其原因,决定芯片性能的并不只有硬件,还有软件,以及软硬件对具体需求的适配。汽车芯片并不是一个完全标准化的行业,不同的主机厂、不同的功能设计,对芯片都会提出不同的个性化需求。
其实,这可以类比手机市场。苹果坚持自研芯片,而非采购高通芯片,更好适配IOS系统,实现软硬件匹配。
在芯片与整车的适配方面,目前的优等生是特斯拉。
特斯拉没有一味强调算力,其FSD自研芯片的算力为144TPOS,但在点到点的驾驶辅助方面,比算力更强大竞争对手反而做得更好。
余凯也在第十四届汽车蓝皮书论坛上展现过一组数据,在国际权威的深度学习图像数据集MS CoCo上的物体检测跑分中,地平线的征程5芯片每秒准确识别帧率(MAPS)高达1283FPS,而英伟达Orin为1001FPS。
每秒准确识别帧率对比
而在典型Backbone1080P模型上,征程5的AI性能和Orin-X不相伯仲,但能效是Orin-X的330%;在优选高效模型下,软硬结合后征程5性能超过Orin-X,能效高达Orin-X的870%。
“我们只有orin芯片售价的一半。”余凯如是说。
国产芯片的独特优势
不拼算力拼性能,国产芯片企业还有一层独特的优势,那就是算力不够,服务来凑。
英伟达Thor的算力固然强大,但从目前的表态来看,它只打算做一个开放式的通用平台,允许主机厂在平台上自行研发适配,而不会亲自下场提供个性化服务。
而国产芯片企业一贯的优势,就是对主机厂服务更加细致。主机厂不擅长软硬件研发,芯片企业可以直接为它们提供个性化开发服务。
理想汽车CEO李想曾感慨,“感谢地平线,中国有这样的芯片企业,未来充满希望。”
相比于理想此前合作厂商Mobileye,地平线显然更打动李想。李想表示,地平线直接派团队入驻理想协作优化智能辅助驾驶功能,经常一起加班到12点解决智能驾驶问题。
不同于地平线开放性工具链算法,Mobileye上一代芯片EyeQ4不支持车企进行本地优化。Mobileye的封闭性造成理想在面对中国道路问题时,只能自行在Mobileye前视摄像头旁增设一个摄像头,用于道路数据采集,对辅助驾驶系统的算法训练。
凭借性价比、本土化服务,地平线、黑芝麻、华为赢得主机厂的订单。比亚迪、一汽红旗征程5前装车型明年面市。华为则是推出车规级智能驾驶计算平台MDC,阿维塔11、阿尔法S搭载MDC810智能驾驶计算平台,长城沙龙机甲龙、广汽 Aion LX Plus、哪吒S等搭载的MDC610平台。
不过,国际芯片巨头并不愿意丢失中国市场。Mobileye推出的EyeQ5已开发软件栈算法,支持第三方代码。同时在中国设立技术团队,协助主机厂解决自动驾驶方案。此外,Amnon Shashua在今年的CES2022亮相的第七代车规级芯片EyeQ Ultra,预计2023年量产的支持L4级别自动驾驶。
中国作为全球最大的新能源汽车市场,已经是兵家必争之地。国内厂商加速下一代芯片研发,地平线方面表示,基于全新BPU纳什架构打造的征程6芯片正在研发中,AI算力可实现数倍提升。而国际芯片厂商已开始发力,弥补服务方面的缺陷,国内芯片厂商能否应对?
一场苦战在所难免,但中国芯片并未失去希望。