一文看懂特斯拉年度 AI 开放日:推出全球最快 AI 计算机,发布人形机器人
全球最快的 AI 训练速度王座,刚刚易主了。
不是英伟达 GPU,也不是谷歌 TPU……
马斯克治下的特斯拉,自研 AI 训练芯片 D1,自研 AI 超级计算机 Dojo ExaPod,首秀即巅峰,登场就是全球第一。
此外,马斯克还带来了另一个特斯拉新品:
汽车机器人,搭载了特斯拉包含芯片在内的软硬件系统,但跟百度的不同,不像汽车更像人。
这就是特斯拉年度 AI 开放日上,马斯克再次带来的一系列激动人心的大进展。
特斯拉自研 AI 训练芯片 D1 发布
马斯克说:要有一个超快的计算机来训练 Autopilot 在内的整个自动驾驶系统。
于是 DOJO 诞生了。
DOJO,取名源自日语里"练武"专用的道场,顾名思义,DOJO 就是特斯拉 AI 不断精益功夫的道场。
DOJO 是一种通过网络结构连接的分布式计算架构。它还具有大型计算平面、极高带宽和低延迟,以及分区和映射的大型网络。
实际上,在 CVPR 2021 现场,特斯拉就已经剧透过 DOJO 的相关性能。
当时总算力达 1.8EFLOPS,读写速度高达 1.6TBps,一度被认为超越全球排名第一的超级计算机富岳,创造超算新纪录。
但那时 DOJO 用的是英伟达的 A100 GPU,单卡算力 321TFLOPS,共计 5760 张,节点数高达 720 个。
而现在,DOJO 更进一步,自研了"心脏"芯片。
特斯拉首款 AI 训练芯片 D1,正式发布。
7nm 工艺,单片 FP32 达到算力 22.6TOPs,BF16 算力 362TOPs。
特斯拉发布会现场,还用图展示性能,拳打英伟达 GPU,脚踢谷歌 TPU。
一句话概括,比现在市面上任何芯片都强。
特斯拉也用"Pure Learning Machine",纯学习机器,来称呼 D1 芯片。
此外,D1 芯片强的不只是单兵作战能力,还有集团军作战能力,它们可以无缝融合,变成超大规模计算阵列。
能有多大,接下来,特斯拉就揭晓了之前预热海报上的"神秘物种":
集合了 25 块 D1 芯片的训练模块!
这也是特斯拉首个训练模块,而把多个模块集合,就能形成更大算力的训练阵列:
至此,特斯拉自研超算 DOJO 完整真身亮相!
超过 50 万个训练节点。每个模块算力为 9 petaflops,带宽为 36TB/s。
DOJO 的可怕之处在于,不同于世界其他超算需要承担多种不同任务,DOJO 的唯一使命就是 AI 训练,或者可以说聚焦到自动驾驶算法的训练。
因为专注,所以首秀即巅峰。
AutoPilot、FSD,特斯拉的其他 AI 训练任务,都能在 DOJO 里更高效练就。
另外,特斯拉官方还继续剧透:这不是终点,下一代 DOJO 还会有 10 倍性能的提升!
所以到这里就完了?拿衣服。
最后也是最强,特斯拉 D1 支持下的终极大杀器登场:
ExaPOD,集成 120 个训练模块,包含 3000 个 D1 芯片,超过 1 百万个训练节点。算力达到 1.1EFLOP。
而且每单位能耗下的性能比当今最强超算高 1.3 倍,但碳排放仅为 1/5。
速度和性能,冠绝业内。
于是特斯拉明确:这就是全球最快的 AI 训练计算机。
有意思的是,2019 年美国能源部曾放言要花 6 亿美元建 E 级算力的超算,2023 年问世……
万万没想到,这个目标被"车企"特斯拉率先实现了。
最强"炼丹炉"为谁而建?
所以问题来了,自研 D1 芯片有了,最强 AI 训练超算 DOJO ready 了,接下来特斯拉会有怎样的改变?
特斯拉 AI 技术主管 Andrej Karpathy(李飞飞高徒)登场,介绍了 D1 芯片和 DOJO,主要服务的对象 -- 特斯拉的在自动驾驶方面领先所有对手的"灵丹妙药":纯视觉方案。
事故频出,争议四起,甚至中国绝大部分玩家都转向了视觉 + 激光雷达的综合方案,但特斯拉依然坚持。
Karpathy 详细介绍了特斯拉高纯视觉方案的思路,和现行 8 摄像头方案的特点,以及它为什么能 work。
特斯拉纯视觉方案,基本构建原则是把自动驾驶系统看作一个生物,有眼睛、有神经、有大脑。
目前的方案有八个摄像头,背后是被称为 HydraNets--"九头蛇网络"的多任务学习神经网络。
"九头蛇网络"可以同时处理目标检测、交通标志识别、车道预测等等任务,其关键在于对各种数据的特征提取,包括不同种类数据的特征共享、对不同任务的分别调参,以及参数缓存,用来加快调参速度。
这也是实现 FSD 敏捷开发,半年内迭代 2-3 个版本的关键。
接下来,Karpathy 描述了纯视觉方案的历史,以及方案发展到今天的逻辑,他展示了一段特斯拉处理其图像数据的视频。
他说过去 的 FSD 虽然很好,但事实证明这样的系统不够完善,每个摄像头能够检测到工程师预期的目标,但背后神经网络的矢量空间是不够的。
于是,特斯拉如重新设计了神经网络,就是上面的"九头蛇"。
另外相机校准、缓存、队列和优化等等环节都做了最大程度简化。
特斯拉方面还比较了多摄像头方案和单摄像头方案的差别,相同的场景下,单摄像头方案识别率明显低于多摄像头方案。
特斯拉车辆上的 8 个摄像头获取原始输入后,系统会创建各种分辨率的图像,用于各种功能和目的。
这些不同的图像会被分别喂给处理不同任务的神经网络,作为整个自动驾驶系统的决策依据。
接着,Karpathy 介绍了特斯拉的"终极建筑师",即车辆在行驶过程中可以实时对车道、环境建模。
车道线实时建模,其实就是特斯拉自己的高精地图能力。
中国自动驾驶玩家,强调"高精度地图"的不少,但特斯拉的思路,"现成资源"不是本质能力,本质能力应该是"创造资源"的能力。
最后,Karpathy 谈了 AI 公司常见的数据标注问题,他认为,把数据外包给第三方去做手工标注并不好,所以特斯拉选择自建团队来给数据打标,目前已经从 2D 图像标记升级到 4D 矢量空间的标记。
这也是特斯拉自动驾驶不断快速进化的核心所在。
依靠人工标注,显然无法应对量产车上路后的大规模数据,所以只有自动化标注,才能形成数据闭环。
开放日上,特斯拉也展示了如何从车道线、2D 图像…… 一点点跃迁至 4D 标注和建模的。
行人、车辆、树木,建筑物…… 清清楚楚,而且还有意图识别。
特斯拉方面也强调,基于类脑一样的感知系统、自动化标注能力,以及仿真,确保了特斯拉为什么可以基于纯视觉实现更高维度的自动驾驶。
仿真,简单讲就是利用现实数据,将真实世界的实时动态景象,在计算机系统实现重新构建和重现。
这套模拟程序,用特斯拉的话说,就是一个以自动驾驶为玩家的视频游戏。
在这套系统里,任何要素都可以被添加其中,包括奇葩的极端场景。
比如这里,人太多导致目标难以标注,车辆极多:
特斯拉这里还不忘补刀一下毫米波雷达 -- 纯视觉也能做很好,所谓的雷达冗余作用有限。
特斯拉方面还披露,现在标注和仿真系统,可以模拟数量高达 3.71 亿的数据及场景。
当然,自动驾驶最后还得解决从比特世界走向原子世界应用的问题。
这次特斯拉主要披露了控制和规划方面的进展。
特斯拉自动驾驶总监 Ashok Elluswamy,分享了特斯拉针对复杂场景的规划方案 --"混合规划系统"。
主要思路和技术方法是基于蒙特卡洛树搜索,实现最佳路径规划。
最后,整个特斯拉自动驾驶从感知到决策规划,一图概括如下:
One more thing:特斯拉"机器人"
最后的最后,就在大家都以为发布会完全就是自动驾驶相关内容之际……
"简短茶歇"环节,竟然来了一段"机器人热舞"-- 宛如衣服 Model 一样的穿着,样子非常"硅基"。
这是特斯拉的行为艺术?
不不不,再次出乎意料。
马斯克再次登台,然后郑重其事发布:特斯拉机器人。
身高 5 英尺 8 英寸,约为 172cm;重量 125 磅,约为 56.7kg;承载能力为 45 磅,约为 20kg。
它的面部是一个显示屏,用来显示重要信息。
从外形上看,四肢和人类一样。
为了实现平衡性和敏捷性,四肢使用了 40 个机电推杆。
同时,特斯拉各项 AI 和芯片技术,都会应用其中。
比如使用 Autopilot 的摄像头充当感知系统,胸腔里内置特斯拉自研芯片 --FSD 同款,还会加持多项特斯拉已开发出的技术,如多摄像头视频神经网络、规划能力、标记。
而且马斯克强调,这不是玩具周边,它会最终实现 -- 可能明年就会正式推出,这是特斯拉电动车的下一步。
硅谷钢铁侠还说,他会是一个非常有用的机器人,由人打造,为人服务,而且会确保一直对人友好,能把人从危险的、重复的,无聊的任务中解放出来。
甚至还能跟已经高度自动化的特斯拉车辆生产进一步结合协作。但按照马斯克的意思,首要的应该是"做家务"。
有意思的是,随着特斯拉这个"机器人"发布,太平洋两岸都把"机器人"作为了智能车变革的下一步。
中国这边,百度李彦宏刚刚推出了一款"汽车机器人",不过更像"汽车"而不是"人"。
美国那头,马斯克的特斯拉机器人,更像"人"而不是"汽车"。
这种区别,也可能跟马斯克的那个江湖绰号有关。
伊隆・马斯克,不就是现实版钢铁侠吗?
2022-05-06 11:55:06