同花顺-圈子

请广大用户注意风险,切勿加入站外群组或添加私人微信,如因此造成的任何损失,由您自己承担。
谈谈特斯拉擎天柱:你笑话它不如铁蛋,其实是你智商不够了
0人浏览 2022-10-03 16:56

  今天和大家聊聊特斯拉的擎天柱机器人Optimus。

  说到机器人这个主题,其实在今年的A股市场上算是熊市中的一抹亮色,不管公司行不行,现炒一波新鲜热辣再说。典型个股如绿的谐波,我们小圈子里面称之为绿毛龟,两个月跑了4倍,极致疯狂。

  话说,最近这半年因为对AI的兴趣,深入接触了艺术,又因为对艺术的兴趣,深入研究了更多的AI。因此,我能够用更工程化的思维去看待这个领域。

  于是,在北京时间十一的清早,特斯拉AI日直播上,我特别有兴致的看了看擎天柱Optimus的直播。

  工作版的擎天柱Optimus 重 73 公斤(161 磅),在其暴露在伺服系统的底盘中装有一个 2.3 千瓦时的电池,并使用第三方执行器,它在自己的动力下四处走动并挥手。

  而另一个外形更商业化的版本,它的底层开发还不够,无法靠自己的力量移动,只是挥手。

  于是,中文直播间里有很多人在喊,这还不如雷军的铁蛋,大家都欠雷军一个道歉。

  但Optimus和铁蛋的差别却可以很大。

  得益于最近这大半年从模型到训练,深入AI各方面的研究,我现在的看法是,这Optimus一旦商用,后续几乎是颠覆式的。

  让机器人动起来,并不难;让它走起来也不难。甚至让它按照既定程式跑起来,做动作,这些都不难。本质上都是大学工程专业的活。

  难的是如何让他自己学会走路,如何具备学习能力。

  机器人没有AI,就谈不上智能;AI达不到智能水平,它和一条废铁咸鱼没什么两样。因此,从2018年开始AUTOML的机器学习就一直是AI的焦点,终究目标就是让AI能自我进化。

  前几年所有的大厂都花了巨大的功夫在NLP自然语义理解上,这本质上做的是AI的认知这一块。

  从目前遍布生活每一个角落的摄像头背后使用的YOLO分类,从每一个APP后面接入的人脸识别,讲的都是认知。

  今年开始火起来的AIGC,讲的是在认知的基础上做创作。这个也非常符合人类的教育演讲逻辑——》既然你能认知,自然你就能复现,检验认知能力的最好标准,就是我告诉AI什么是一只狗,然后AI把它精确的画出来。

  而在机器人领域上,它不仅要知道什么是一只狗,还需要知道用什么行为去对待一只狗。这其中的进化,靠的全是训练。

  我想用建楼房来形容特斯拉在发布会展示的内容,他们是把整个楼是怎么建的,从原理到用料再到过程都给你展示一遍,这里面有大量的技术过程,他们实际上都拿出来讲了。当然,受众未必听得懂。

  在特斯拉的AI DAY,我们看到他们年轻的工程师花了大量的时间去讲他们是怎么训练的。全是硬核的内容。

  比如,对机器人的训练相当一部分基于特斯拉FSD自动驾驶的训练基础。

  在FSD部分,特斯拉工程师团队解释了他们如何将汽车的决策能力提升 10 倍到100毫秒级别。 FSD 的技术首先 把Teslas 周围的世界全景实时建模并映射为 全数字环境,并根据周围的环境做出选择。这个在元宇宙领域被称为数字孪生,背后需要巨大的算力支持。

  这和基于激光雷达和视觉的自动驾驶机制是完全不一样的。反过来说,目前仅仅基于视觉和激光雷达的方案,对于前方路线突然侵入的人和车,自动驾驶的反应能力是堪忧的。

  那么,为什么是100毫米级别呢?各位看官,人脑的反应速度一般在100-300毫秒以内。也就是FSD的决策也同样需要这样。

  为了训练 FSD 模型。特斯拉组建了三台超级计算机,也称为 Dojo 超级计算平台,目前由 14,000 个 GPU 组成——其中 10,000 个用于训练,4,000 个用于标记。一个Dojo Exapod的算力规格是1.1 EFLOP、1.3 TB SRAM 和 13 TB DRAM。

  1.1EFLOP(相当于每秒计算1.1亿亿次,你没看错,是亿亿)的算力,是什么概念?根据工信部数据,中国今年6月为止全国算力总规模大概是140E FLOPS。

  作为对比,国内的蔚小理是怎么样的呢?

  公开资料显示,蔚来从未提及自己的超算训练,所有宣传里面只有基于车身算力的所谓 "蔚来超算平台Adam",由四颗NVIDIA Drive Orin芯片构建。

  相比之下,小鹏汽车在乌兰察布建造的自动驾驶专用智算中心“扶摇,公开算力规模是600PFLOPS,相当于0.6EPFLOS。

  理想和蔚来类似,后端的超算训练从未提及,所有宣传只有基于车身的算力和反应系统。

  目前市场通用的训练级GPU,比如说英伟达的A100,一个是7万块人民币。据此推算,一台DOJO至少是10亿级别。这样的算力支持下迭代更新的内核,机器人的AI成长会像武侠小说里面常用的“在脑海中修炼绝世武功,一日千里”这种烂梗桥段一样匪夷所思。

  但这就是硬打硬的实际训练基础,小到聊天机器人,玩具机器人,大到自动驾驶,核心的语义识别模型,行为模型都是这样实打实训练出来的。

  我想用建楼房来形容特斯拉在发布会展示的内容,他们是把整个楼是怎么建的,从原理到用料再到过程都给你展示一遍,这里面有大量的技术过程,他们实际上都拿出来讲了。当然,受众未必听得懂。

  在特斯拉开完发布会之后,有些看不懂的人笑话它还不如铁蛋,尤其是自媒体领域,我想说的是,其实是你智商不够了。

  中文体系里面大部分的消费者最近这些年接受的发布会模式,实际上源自于那个下周回国让梦想再一次窒息的男人贾布斯。贾布斯产品做不好,但不影响他仍然是PPT融资的顶级高手。

  同样,雷布斯展示的铁蛋也存在这种问题,它只展示了它能走路,能把花给你,它还能做什么?它基于什么样的体系开发?小米用了多大的算力去开发铁蛋呢?

  概念先行在商业上没什么问题,但概念先行如果缺了基础,就如同开发商拿了没打地基的房子卖楼花,真要交付的时候那就是人命关天的。

  最后,感谢你看完本文。下次和你分享更多的AI感悟。

更多
· 推荐阅读
0
1
扫码下载股市教练,随时随地查看更多精彩文章
发 布
所有评论(17
  • 17
  • TOP
本文纯属作者个人观点,仅供您参考、交流,不构成投资建议!
请勿相信任何个人或机构的推广信息,否则风险自负