跳转至

Tesla FSD

Tesla(特斯拉)是全球最大的电动汽车公司,也是自动驾驶领域最具争议性的玩家。Tesla 的自动驾驶策略与行业主流截然不同:放弃激光雷达、依赖纯视觉,通过数百万辆车的数据飞轮迭代进化。这一路线被批评者称为"危险的冒险",被支持者视为"正确的终局"。

核心理念:纯视觉路线

Tesla CEO Elon Musk 于 2019 年在 Autonomy Day 上发表了著名言论:

"LiDAR 是傻瓜的差事。依赖 LiDAR 的人注定失败。"

Tesla 纯视觉路线的逻辑: 1. 人类用眼睛开车:道路系统是为人眼设计的(交通标志、标线、信号灯均为视觉信号),AI 也应该用"眼睛"驾驶 2. 规模经济:摄像头成本极低(每个 < $50),LiDAR 成本极高(每套数千至数万美元),纯视觉方案可大规模部署 3. 数据飞轮:全球数百万台 Tesla 车辆同时采集数据,纯视觉系统可从真实人类驾驶行为学习

FSD 芯片演进

Tesla 的自动驾驶能力与芯片能力深度绑定,是唯一自研 AI 芯片的整车厂:

代际 型号 发布时间 AI 算力 主要变化
HW1 Mobileye EyeQ3 2014 约 4 TOPS 依赖第三方,功能简单
HW2 NVIDIA Tegra X2 2016 约 12 TOPS 具备深度学习潜力
HW2.5 NVIDIA Parker + Pascal GPU 2017 约 100 TOPS 过渡版,双系统冗余
HW3 / FSD Chip 自研 NPU × 2 2019 144 TOPS × 2 = 288 TOPS 完全自研,双芯冗余,效率提升 21 倍
HW4 / AI5 自研下一代 2023 约 300+ TOPS 支持更高分辨率摄像头,为 FSD V12 准备

HW3 FSD Chip 技术亮点(Tesla Autonomy Day 2019 披露): - 制程:Samsung 14nm,60 亿晶体管 - 每颗芯片含 2 个 NPU(Neural Processing Unit),设计算力 72 TOPS/颗 - 每帧推理能耗仅 2 W,远优于同等算力 GPU - 双芯片封装提供硬件冗余,任一芯片失效另一个接管

HW4 的摄像头升级: - 摄像头分辨率从 1.2 MP 提升至 5 MP(部分车型) - 新增高动态范围(HDR)传感器,改善逆光和隧道场景 - 由 8 个摄像头调整为 7 个(去除 B 柱摄像头,新增 Autopilot 摄像头)

神经网络架构演进

Tesla 的感知算法历经多代革命性演进:

早期(2016–2019):逐摄像头 2D 检测

各路摄像头独立运行 2D 目标检测,通过几何融合(三角测量)估计 3D 位置。问题:融合误差大,遮挡场景表现差。

BEV 感知范式(2021 AI Day)

Tesla 引入将多摄像头特征统一投影至鸟瞰视角(BEV)的感知架构:

8路摄像头帧 (当前帧 + 历史帧队列)
     │
RegNet 图像骨干(特征提取)
     │
BiFPN 特征融合
     │
Transformer(空间位置编码,跨摄像头注意力)
     │
BEV 特征图(统一 3D 表示)
     │
┌───────────────────────────┐
│ 车道线检测 │ 目标检测     │
│ 占用网格   │ 可行驶区域   │
└───────────────────────────┘

时序融合: 利用历史帧建立视频级 BEV 特征,解决单帧遮挡问题。这是纯摄像头补偿深度估计不确定性的关键技术。

Occupancy Network(2022 AI Day)

将三维空间划分为体素网格,预测每个体素的占据概率和语义类别: - 可以表示任意形状的障碍物(不受边界框限制) - 可以表示地面、墙壁、植被等非车辆障碍物 - 输出为"世界的 3D 密集表示",供规划模块使用

端到端 FSD V12(2023)

Tesla 宣布将超过 300,000 行的 C++ 模块化代码替换为统一端到端神经网络:

  • 输入:8 路摄像头图像序列
  • 处理:大规模 Transformer 神经网络(无手工规则)
  • 输出:车辆控制量(转向角、油门、制动)
  • 训练:海量人类驾驶行为的模仿学习

Elon Musk 表示:"FSD V12 是真正的 AI,不是愚蠢的代码。"城区驾驶表现获得大幅提升,处理路口等复杂场景的能力明显增强。

数据飞轮

Tesla 最核心的竞争壁垒不是算法,而是数据

车队规模

  • 全球 FSD 激活车辆:约 200 万辆(2024 年,付费 FSD 订阅 + 试用)
  • 每天数据量:约 160 PB 视频数据(按每辆车 8 路摄像头 × 每天 30 分钟行驶估算)

影子模式(Shadow Mode)

Tesla 系统在实车行驶中持续运行自动驾驶推断,记录: - 若系统自主接管,会做出什么决策 - 实际人类驾驶与系统预测的差异("介入触发器")

这些差异数据被自动标记为需要改进的训练样本,无需人工标注。每次 OTA 推送后,Tesla 可以评估全球车队的"虚拟干里程"(Shadow miles)。

自动标注(Auto-Labeling)

由于没有 LiDAR,Tesla 无法直接获取精确 3D 标注。解决方案:

离线重建(Offline Reconstruction): 1. 收集同一地点多辆车多次经过的视频 2. 利用多帧 + 多视角点云重建精确 3D 场景 3. 用高质量重建结果为单帧摄像头图像提供伪 LiDAR 标注 4. 规模化自动标注替代手工标注

这一流程使 Tesla 能以极低的人工成本生成海量高质量训练数据。

Dojo 超级计算机

Tesla 自研超算集群,专为神经网络训练设计: - 自研 D1 训练芯片(2021 发布),峰值算力 362 TFLOPS @ FP32 - 训练瓦片(Training Tile)= 25 × D1 芯片,用 SerDes 直连,无需 NVLink - 目标:构建 100 ExaFLOP 规模的训练能力 - 战略意义:摆脱对 NVIDIA GPU 的依赖,掌控训练基础设施

FSD 功能现状(截至 2024)

功能版本历史

版本 发布时间 主要能力
Autopilot(HW1) 2015 ACC + LKA,高速公路 L2
Autopilot 2.0 2016 自动变道、自动泊车
FSD Beta V9 2021 城区街道辅助驾驶(需持续监督)
FSD V11 2022 统一单一驾驶栈(城区+高速)
FSD V12 2023 端到端神经网络,城区能力大幅提升

定价策略

区域 购买选项 价格(参考)
美国 买断 $8,000
美国 月订阅 $99 / 月
中国 买断 约 64,000 元人民币
中国 月订阅 约 756 元 / 月

监管争议

  • NHTSA 调查:多项 Autopilot / FSD 涉事事故(前方静止车辆、紧急车辆)触发调查,召回数百万辆并通过 OTA 修复
  • "完全自动驾驶"命名争议:美国加州 DMV 认为该名称具有误导性(实际仍是 L2 级,需驾驶员监督),强制要求 Tesla 澄清
  • 中国市场推进:2024 年获准在上海测试 FSD,但数据本地化要求使中国版本需要单独训练

Robotaxi 计划(Cybercab)

2024 年 10 月发布:

Tesla 发布 Cybercab 概念车,主要特点: - 无方向盘和踏板(L5 设计) - 线控双摄像头感知 - 计划 2026 年以 < $30,000 价格开始量产 - 目标:建立 Tesla 自营 Robotaxi 车队,同时允许车主将私家车接入共享网络

与 Waymo 的战略对比:

维度 Waymo Tesla
核心假设 安全驱动规模(先验证安全,再扩大) 规模驱动安全(数据越多越安全)
商业路径 专用 Robotaxi 车队运营 私家车共享网络 + 专用 Cybercab
成本结构 高(多传感器 + HD Map) 低(纯摄像头 + 轻地图)
上市规模 数千辆 目标数百万辆(借助现有产线)

参考资料

  1. Tesla. Autonomy Day Presentation, April 2019.
  2. Tesla. AI Day Presentations, 2021, 2022.
  3. M. Bojarski et al. End to End Learning for Self-Driving Cars. NVIDIA, arXiv:1604.07316, 2016.
  4. NHTSA. Tesla Autopilot / FSD Investigation Reports, 2022–2024.
  5. 中国信通院. 智能网联汽车发展报告, 2024.