五大计算平台竞逐高阶自动驾驶量产,谁是最强芯片?

五大计算平台竞逐高阶自动驾驶量产,谁是最强芯片?

来源:汽车之心

作者:周彦武

01.png牛牛敲黑板:

1、Mobileye EyeQ6:拥抱英特尔,追逐高性能。

2、瑞萨R-CAR V3U:强势日系厂商,灵活高性价比。

3、英伟达Orin:极致性能,新造车青睐。

4、高通Snapdragon Ride:进击的移动芯片霸主。

5、华ÎMDC:Â货之光,封锁之下何去何从。

6、作者认Î,最终高通Ê瑞萨Æ希望胜出。

自动驾驶系统前装量产的开Ï周期Ë约 2 到 3 É,因此计算平台厂家都È提前 2 到 3 É提供芯片样片。

整个系统开Ï完成后,芯片才开始量产。

这样Á来,实际上 2023 É后的自动驾驶芯片格局,今天就已经基本确定Å。

自动驾驶芯片开Ï成本高昂,且出于对高性能、低功耗的要求,其制造至少需要 7 纳米Ê 5 纳米的制程工艺。

这个级别的工艺对出货量要求比较高:

Á方面因Î台积电几乎垄断 7 纳米以下的高性能芯片代工,产能紧缺。

订单量太低的话,芯片厂商将Ã台积电的序列Ç等待排期。

这个排期长达 1 É半到 3 É。

Ã这个时间内,芯片厂商肯定会失去客户。

另Á方面,7 纳米以下芯片的开Ï成本高昂,动辄 10 亿美元起。

如果没Æ足够多的出货量摊销,芯片单价会很高,反过来也会影响销售。

Ã现Ã市场的主要玩家Ç,特斯拉Ê苹果的系统封闭软硬Á体化,Í对外单独出售芯片。

华Î提供 MDC 计算平台,但其芯片也Í对外单独出售。

当前,能够提供高性能自动驾驶芯片,并Ã市场Ç拥ÆÁ席之地的全球独立芯片厂商主要还Æ:Mobileye英伟达瑞萨高通

其对应的芯片产品如下:

图片

因Î这些芯片涉及到多个版本,这里对比的都È顶配产品。

Mobileye EyeQ6:拥抱英特尔,追逐高性能

2019 É底,Mobileye EyeQ 芯片全球累计出货超过 5400 万片。

2020 É 9 月,Mobileye 透露,EyeQ 芯片全球出货量超过 6000 万片

这 6000 万片È EyeQ2、EyeQ3 Ê EyeQ4 之Ê,其Ç 2020 É新增的部分主要È EyeQ4。

目前 EyeQ5 还未批量出货。

图片

EyeQ5 提供的算力水平È最高 24 TOPS,跟其他几家相比,这个算力水平要逊色Í少。

EyeQ6 才È Mobileye 真正Ï力高性能的高端。

EyeQ6 预计于 2024/2025 É量产,分Î高Ç低三个版本。

Mobileye à 2016 É开始设计 EyeQ5,选定Å MIPS 的 I6500 做架构。

MIPS Ã I6500 架构之上,推出Å特别针对车规的 I6500-F,而后续的 I7200 È针对无线市场的。

因此,MobileyeÃ之后的Á代芯片上,放弃Å MIPS 架构,而决定采用英特尔的 Atom 内核[1]。

Atom È英特尔处理器系列的常青树,典型车载平台È Apollo Lake。

2016 É 6 月,英特尔从 Apolllo Lake 切换到 Goldmont 架构,并先后Ã特斯拉、宝马、卡迪拉克、红旗、现代、沃尔沃、奇瑞的车机上Ë量使用。

其Ç宝马采用的最多,几乎全系列都È。

特斯拉 Model 3 也È用的 Apolllo Lake。

最新的 Atom 系列,È 2020 É 9 月推出的 Elkhart Lake 系列即 x6000E,使用 Tremont 架构。

图片

相比上代架构,Tremont 架构主要增加Å L2 cache,工艺从 14 纳米提升到 10 纳米,运行频率略微提高约 200MHz,最高睿频可达 3.0GHz。

Ê上Á代Á样,Tremont 架构最多也È4核。

整体上,Mobileye 的芯片更新速度较慢。

加上最近英特尔的 CPU 核心Ì务受到来自苹果、微软Ê AMD 的打击,公司市值下滑明显。

EyeQ6 要到 2024 É才量产,Ã各家的竞争Ç也显得Æ些落后Å。

瑞萨R-CAR V3U:强势日系厂商,灵活高性价比

瑞萨È全球第二Ë汽车半导体厂家,全球第ÁË汽车 MCU 厂家,也È日本除索尼(索尼的主营Ì务主要È图像传感器)外最Ë的半导体厂家。

Ã高性能车载计算方面,瑞萨目前最顶级的产品ÈR-CAR H3,主要用Ã座舱领域。

最初 R-CAR H3 也考虑Å自动驾驶应用,但 R-CAR H3 设计时间È 2013 É。

很难预料到今天客户对AI算力Ê CPU 算力的需求这么强。

R-CAR H3 没Æ内置 AI 加速器,CPU 算力也只Æ 40K,显然达Í到自动驾驶系统开Ï的要求。

目前主要被用Ã座舱量产Ç,比如 2021 款长城 H6。还Æ R-CAR M3 被用于Ë众ÇÂ车型的座舱上。

瑞萨Ã 2017 É开始加强高算力芯片的设计。

2019É推出第Á个视觉 SoC,即R-CAR V3H

这颗芯片的 AI 算力Æ 4 TOPS,博世的下Á代视觉系统内嵌 V3H,也包括Á些日系的全自动泊车系统。

2018 É,瑞萨开始设计 V3H 的加强版 V3U,到 2020 É基本完成设计。

目前外部已经可以申请 V3U 的样片,这个速度比其他三家都要快Á些。

V3U 的量产预计Ã2023 É初,丰田Ê本田也参与Å这款芯片的设计工作。

日本车企Ê供应商之间的抱团非常紧密,我认Î丰田Ê本田自动驾驶系统Ë概率会采用 V3U。

图片

V3U 内部框架如上图:采用 8 核 A76 设计。

瑞萨没Æ像特斯拉Á样,堆Å 12 个 A72,而È使用Å ARM 的 Corelink CCI-500,即 Cache Á致性互联。

图片

V3U 的视频处理管线如上图,可以看到 V3U Æ很多硬核的计算机视觉模块,包括立体双目视差,稠密光流、CNN、DOF、STV、ACF 等。

Ã计算机视觉功能方面,支持包括图像格式化、目标追踪、车道检测、自由空间深度、场景标注、语义分割、检测分类等模块。

ÎÅ节约成本,降低功耗,同时也聚焦于车载应用需求,瑞萨没Æ使用太昂贵的 GPU,只È增加ÅÁ个低功耗 GPU,即:

图片

Imagination Technologies 的 PowerVR GE7400,1 个着色器集群+ 32 个 ALU核心,算力只Æ38.4 GFLOPS@600MHz。

图片

考虑到成本因素,瑞萨没Æ使用时髦的 7 纳米,而È12 纳米工艺,并且È从原瑞萨 R-CAR H3 的 16 纳米 FinFET 工艺升级到 12 纳米 FFC 工艺,Á次性支出很少。

但È论到 AI 性能,丝毫Í次于那些 5 纳米芯片,瑞萨声称 V3U 达到Å惊Ä的 13.8 TOPS/W 的能效比,È顶配 EyeQ6 的 6 倍之多[2]。

图片

V3U 也ÈÁ个系列产品,针对Í同层级自动驾驶的需求可以提供多个版本,这样做ÈÎÅ进Á步提高出货量,降低成本。

V3U 的产品系列采用的È模块化设计,A76 可以È 2、4、8 核。

GPU 也可以Í要,外设也可以轻松增减,灵活性很强。

à Mobileye、瑞萨、英伟达、高通四Ë自动驾驶芯片厂家Ç,只Æ瑞萨的主ÌÈ汽车半导体,因此对车规安全重视程度最高,V3U 的规划目标ÈASIL-D

英伟达 Orin:极致性能,新造车青睐

英伟达于 2019 É底Ï布Å Orin 芯片:

预计Ã 2022 É或 2023 É量产,2021 É初Æ样片提供。

图片

关于 Orin 的公开资料Á直还停留Ã 2019 É底Ï布时。

据说围绕 Orin 的软件工作异常复杂,硬件已经完全就绪,可能要到 2023 É底才能量产。

Orin 性能Á流,但价格可能非常昂贵。

L4 级自动驾驶,自然也È非常昂贵的。主芯片上降低几百美元,对上万美元的系统来说也È杯水车薪。

Ë部分厂家Ã L4 的投入上,都ÈÎÅ树立旗帜,制造高科技形象。

Ë规模量产难度很高,配套的 V2X、高精度地图Ê高精度定位都很Í成熟,法规也需要修改。

因此,开Ï初期厂商对成本Í敏感。换句话说,车厂没指望Ã主芯片上降低成本。

图片

与 R-CAR V3U Á样,英伟达 Orin 也ÈÁ个系列产品。

后者的低端产品可能只Æ 2 到 4 个 A78 内核,20 到 40 TOPS 的 AI 算力,可能没Æ Ampere GPU 或少数核心。

高通Snapdragon Ride:进击的移动芯片霸主

图片

关于高通Snapdragon Ride的公开信息很少。

高通的核心Ì务还ÈÃ移动端,因此高通的策略È最Ë程度地利用手机领域的研Ï成果。

图片

按照这个策略,高通最新的Snapdragon 888(即 SM 8350)芯片会最接近 Snapdragon Ride SoC。

高通的 Ride 平台Ê英伟达类似,也È基于 SoC+AI 加速器的分离方式。

高通声称 888芯片会采用三星 5 纳米 5LPE 工艺制造,并且È两É半前就决定的。

但目前三星的 5 纳米还没ÆÁ个厂家使用,而台积电的 5 纳米已经经过苹果 A14 验证过。

论关键指标晶体管密度,三星的 8 纳米与台积电的 12 纳米差Í多。

三星的 5 纳米跟台积电的 10 纳米差Í多,明显低于台积电的加强版 7 纳米。

但台积电 5 纳米产能被苹果包Å,高通只能找三星。

à 888 芯片上:

Arm 的 Cortex-A78 Ê Cortex-X1 都È基于上Á代 Cortex-A77。

但这两款 Arm 处理器的设计目标Í同:

Cortex-A78 侧重于提供更高的每瓦性能,同时体积更小,而 Cortex-X1 则È追求最Ë性能。

Cortex-X1 È Arm「CXC 项目」的第Á款商用产品。

性能方面,Cortex-X1将比 Cortex-A77 提高 30%。

与 Cortex-A78 相比,Cortex-X1 的整数运算性能提升Å 23%。

Cortex-X1 还拥Æ两倍于 Cortex-A78 的机器学习能力。

Cortex-X1 就相当于「超Ë核」,它Ã架构设计上与 Cortex-A78 如出Á辙,但几乎Ã每个地方都进行Å扩展。

ARM对 Cortex-X1 的定义È「可定制」移动平台,芯片商可以根据预算Ê需求向 ARM 提出要求。

然后 ARM 再根据Í同的应用场景,调整 Cortex-X1 各个模块的规格设计。

图片

即便 S888 非常强Ë,但因Î三星的 5 纳米工艺,晶体管密度远Í如台积电 5 纳米,也Í如台积电 7 纳米。

因此,S888 的单核性能仍然落后苹果上Á代的 A13,跟台积电 5 纳米的 A14 比差距更È非常明显,A14 比 S888 单核跑分高 41%。

GPU 方面更能凸显三星工艺的落后。

根据 GFXBench Aztec 测试:

  • A14 峰值达到每秒 102.24 帧

  • A13 达到 91.62 帧

  • S888 只Æ 86.00 帧

  • 华Î的麒麟 9000 È 82.74 帧。

AI 性能方面,S888 得分很高,用 UL Procyon 测试 AI 推理Î 32228。

华Î的麒麟 9000 È 12596,S888 几乎È麒麟的三倍。

S888 理论值 26 TOPS,也比苹果 A14 的 21 TOPS 高。

Ride 平台应用于自动驾驶领域,因此高通可以砍掉 S888 上的 X60 5G Modem,留出更多地方放 NPU,AI 算力估计可以达到 30-40 TOPS。

考虑到成本Ê车规,高通Í会增加太多 AI 算力,因Î高通还留Å加速器,也就È类似英伟达 A100。

华Î MDC:Â货之光,封锁之下何去何从

华Î的自动驾驶计算平台由车 BU 下的 MDC 产品部负责。

MDC 上采用的 AI 协处理器È昇腾系列芯片,而 CPU 来自华Î的泰山服务器事Ì部,即鲲鹏系列芯片

图片

MDC 全称ÈMobile Data Center,移动数据Ç心。

MDC 的成员部分来自华Î的Ç央硬件部,后者以开Ï ARM 服务器Î主要Ì务,之后转到自动驾驶领域。

MDC 的芯片部分仍由海思提供。

MDC 目前主打两款产品:

  • Á款È用Ã L2+ 上的 MDC 210

  • 另Á款 MDC 610,主要用Ã L4 上

MDC 210 的 CPU 部分未知,AI 处理器È昇腾 310

MDC 610 的 CPU 很可能È鲲鹏 916,AI 处理器È昇腾 610

图片

鲲鹏 916,Ã海思内部代号È Hi1616,È 2017 É的产品。

其采用 32 核 ARM A72 并联设计,最低功耗 75 瓦,标准 TDP 功耗 85 瓦,对标英特尔至强系列服务器 CPU。

图片

华Î鲲鹏 916 参数与内部框架图如上:

采用Å16 纳米工艺,也就È说Ç芯Â际能够代工。

图片

鲲鹏系列更高级的产品È 920,海思内部代号 Hi1620,采用Å 16 - 96 核设计,华Î自研的架构,ARM v8.2 指令集,7 纳米工艺。

鲲鹏930 计划采用 5 纳米工艺。

上面说到,华Î MDC 的 AI 处理器主要È昇腾 310 Ê 610。

图片

按照华Î的路线图,官方原计划Ã 2020 É推出昇腾 320、610 Ê 920,但Á直到目前都没Æ消息。

昇腾 310 È采用台积电 12 纳米 FFC 工艺制造,于 2018 É推出,因此性能Á般,只Æ 16TOPS 算力。

从华Î的官方介绍看,昇腾920 Ê 610 都È定位于服务器深度学习训练用的,ÍÈ用于车载应用。

这两款处理器Æ明显的 Cowos 多存储芯片封装设计,这种封装成本也很高,Í适用于成本敏感的领域。

谁È最强芯片?

整体回顾:五Ë厂商Ç,瑞萨主打超高性价比,并且设计之初就Æ整车厂支持。

Ã日系车企Ç,除ÅÂ际化程度比较高的日产,其他厂商毫无疑问都会倾向于瑞萨的 V3U。

瑞萨Ã车规安全方面积累较多,这也È德系厂商非常关心的。

因此出身车载半导体领域的瑞萨比较受日系Ê德系厂商青睐。

MobileyeÆ超过 6000 万片出货,Æ庞Ë用户基础,美系、韩系还ÆÂ内自主品牌都倾向于 Mobileye,但目前 EyeQ 系列产品推出速度太慢

这也È理想、蔚来等多家新晋厂商放弃 EyeQ 平台的原因。

英伟达性能Á流,至于价格,用黄教主的话说,「买得越多,省得越多」。

新兴造车企Ì追求高性能,蔚来、理想、小鹏几家手上也Æ几百亿元的现金储备,英伟达Ã其Ç颇受青睐。

高通Snapdragon Ride 平台与瑞萨类似,主打性价比,并且高通的原厂支持力度比较Ë。

目前,长城以及Á家众所周知的造车新势力头部公司已经选择Å Ride 平台。

华Î最Ë的掣肘因素Ã于芯片的产能。

目前Ç芯Â际的 14 纳米工艺Í算成熟,从财务数据看,Ç芯 14 纳米Ì务仅占其收入的 1%。

眼下Ç芯Â际也被美Â制裁,工艺Ê产能提升都十分困难。

即便解除封锁,华Î也Í会对外单独销售芯片。

无论车企选择使用哪个平台,都需要芯片原厂提供充足的支持。

Ã这方面,瑞萨高阶的原厂工程师都Ã日本,支持力度较差。

英伟达Ä力资源Æ限,据说其支持力度也Í太友好。

高通Ã经历移动端的多É磨砺,非常适应于Î几十个厂家做支持。

结合 Mobileye 的推新节奏,我认Î,最终高通Ê瑞萨Æ希望胜出。

参考资料:

[1]https://www.eenewsautomotive.com/news/we-need-standardized-criteria-autonomous-driving/page/0/4。

[2]https://eetimes.jp/ee/articles/2012/21/news067.html,CNN-IPも自社で開発したものだ。理論上の最高性能は60TOPSで、1W当たりの性能は最高で13.8TOPS。

编辑/Jeffy

本文由星云财经网发布,不代表星云财经网立场,版权归原作者所有,若侵犯了您的权利请与我们联系。