马斯克传——车用人工智能1
正中、不越过双黄线闯入对面车道、通过交叉路口时保证其他车辆的行驶速度不足以撞上我方车辆。特斯拉的工程师手动编写
并更新了数十万行C++代码,以便将这些规则应用于更复杂的情况。史洛夫正在做的神经网络路径规划项目将把这套系统提
升到新的层面。他说:“我们不再只根据规则确定车辆的正确行驶路线,而是通过神经网络来确定车辆的正确行驶路线。”换
句话说,这是对人类的模仿。面对某种情况,神经网络会根据人类在数以千计的类似情况下所做的事情规划路径。这就像人类
学习一切行为的方式一样——说话、开车、下棋、吃意大利面……我们可能会被赋予一套需要遵循的规则,但我们主要是通过
观察其他人的做法来掌握这些技能。这是艾伦·图灵在1950年发表的论文《计算机器与智能》中设想的机器学习方法。特
斯拉拥有世界上用于训练神经网络的最大的超级计算机之一,它由人工智能计算公司Nvidia的图形处理器(GPU)驱
动。马斯克在2023年的目标是逐渐过渡到使用Dojo,Dojo是特斯拉从零开始打造的一款超级计算机,它使用视频
数据训练人工智能系统,拥有特斯拉人工智能团队内部设计的芯片和基础架构,每秒近800亿亿次浮点运算的处理能力,使
其成为世界上服务于这一目标的最强大的计算机。它将用于自动驾驶软件和Optimus。马斯克说:“把它们放在一起工
作非常有意思,它们都在努力为这个世界指引前进的方向。”到2023年年初,神经网络路径规划项目已经分析了从特斯拉
客户车辆上收集的1 000万帧视频画面。这是不是意味着它只能达到人类驾驶员的平均水平呢?史洛夫解释说:“不,因
为我们只在人类处理各类情况处理得还不错的时候才使用他们的数据进行学习。”纽约布法罗的人类标记员会对视频进行评估
并给出分数。马斯克让他们找出“Uber五星司机会采取的做法”,而这些视频就是用来训练计算机的。马斯克经常在特斯
拉位于帕洛阿尔托的大楼里走来走去,自动驾驶工程师坐在开放的工作区里,他会半跪在他们身旁,即兴讨论一些问题。有一
天,史洛夫向他展示了他们取得的进展。马斯克对此印象深刻,但他有一个疑问:是不是真的需要这种全新的方法呢?会不会
有点儿矫枉过正呢?马斯克的一句座右铭就是:永远不要用导弹打苍蝇,你应该用苍蝇拍。为了处理一些不太可能发生的、边
边角角的极端情况,用神经网络来规划路径会不会是一种过于复杂的方式呢?史洛夫向马斯克展示了神经网络路径规划比基于
规则的方法更有效的实例。演示中的道路上到处都是垃圾桶、倒下的交通锥筒和散落的杂物。在神经网络路径规划的引导下,
车辆能够绕过障碍物,越过车道线,并在必要时打破一些规则。史洛夫告诉马斯克:“当我们从基于规则的算法转向基于神经
网络的路径算法时,这种情况就会发生,即使在混乱的环境中,如果你打开了这项功能,车辆也不会发生碰撞。”这种跨越到
未来的感觉让马斯克兴奋不已。他说:“我们应该做一次像007系列电影场面的酷炫演示,四面八方都有炸弹爆炸,不明飞
行物从天而降,而这辆车飞速驶过,不会撞到任何东西。”机器学习系统在进行自我训练时通常需要一个目标或指标作为指导
。马斯克在管理时喜欢通过下命令的方式来决定哪些指标最重要,于是他给了他们一个标准:特斯拉全自动驾驶车辆在没有人
类干预的情况下能够行驶的里程数。“我希望每次开会的第一张幻灯片都能展示每次干预前自动行驶里程的最新数据。”马斯
克说,“如果训练人工智能,我们应该优化什么?答案是提高两次干预之间的行驶里程数。”他告诉他们,要像打游戏一样,
每天都能看到自己的得分。“没有分数的电子游戏是无聊的,所以每天看着单次干预前的里程数增加就会很有干劲儿。”团队
成员在工作区安装了85英寸的巨大显示屏,实时显示完全自动驾驶车辆在没有干预措施的情况下平均行驶了多少英里。每当
他们看到某一类干预措施再次出现,比如驾驶员在变道、并线或转弯进入复杂路口时抓住了方向盘,他们就会同时与规则团队
和神经网络路径规划团队通力合作,对这一问题进行修复。他们在办公桌附近放了一面锣,每当他们成功解决了一个导致干预
出现的问题,他们就敲一次锣。