特斯拉人形机器人的发展历史、主要成果及技术进步梳理

发布时间:2024-02-09 17:51:59   来源:博亿堂娱乐官方网站

  —— WABOT-1。此后全球陆续推出不同品类、应用在不同场景的人形机器人,除推出。但人形机器人产业化难度大,根本原因在于关键技术掣肘、成本仍高昂、应用场景有限等,本田、软银等

  2021年AIDay上,马斯克发布了特斯拉的人形机器人计划,当时的Tesla Bot仅是概念。历时1年,在2022年9月的AI Day上,人形机器人Optimus正式亮相。随后2023年5月的股东大会,Optimus已可以在一定程度上完成物品分类等更复杂的任务。2023年12月,Optimus Gen-2视频发布,Gen-2实现了更为灵活的行走,能轻松拿捏鸡蛋并实现左右手的转移等更为精细化的动作。在不到三年时间内Optimus实现快速迭代发展,人形机器人产业化或将呈现由点到面、在某一阶段快速渗透的趋势。

  接下来,笔者将带领大家一起回顾和总结学习3年来,特斯拉人形机器人的发展历史、主要成果及技术进步等做以梳理和拆解。以便大家探索特斯拉人形机器人快速迭代升级的原因,未来如果售价不超过2万美元,产业化核心痛点击破后是否能将带动行业快速发展。

  2021年8月20日的AI Day,特斯拉公布了纯视觉方案FSD的进展、训练、D1芯片、Dojo超级计算机等重磅信息。最后,特斯拉首次展示了其人形机器人的概念, 名叫Tesla Bot。笔者以为,FSD、神经网络训练、超级计算机等看似为汽车行业做配套,实则是为人形机器人的采集训练所需要的各种模型参数和提供强大的算力基础设施,为人形机器人做好了大量铺垫。

  Tesla Bot身高约1.72米,体重约56.7kg,集齐前述的FSD、车载计算机、Autopilot摄像头和40个微型电机等所有技术与一身,可谓人工智能技术的最终极形态呈现。技术细节上,头部被安装用于导航的摄影机,透过人工神经网路(Artificial Neural Network)驱动,面部有一块萤幕,用于展示与提供讯息,手部可以执行宛如人类手部程度的动作。

  特斯拉的纯视觉传感器方案的实现,离不开多任务学习HydraNets神经网络架构。每辆特斯拉汽车拥有8个环绕车身、覆盖周围360°的摄像头,来获取交通信号灯、信号牌、匝道、路缘等周边信息,为神经网络学习提供了绝佳条件。

  特斯拉开发了“矢量空间”(Vector Space)技术,同时兼具了非凸优化算法(Non-convex)、高维度两大优势。该技术能通过8个摄像头输入的数据为基础绘制3D鸟瞰视图,形成4D的空间和时间标签的“路网”以呈现道路等信息,帮助车辆把握驾驶环境,更精准的寻找最优驾驶路径。

  有了海量、精准的视频数据,特斯拉还需要创造一个强大的神经网络,并对网络进行特殊的布局,使这一些数据能在一个总的主干网络上进行整合和重新分析。因此,特斯拉“高楼平地起”,自主研发了基于神经网络的训练方式。

  同时,特斯拉还开发了“仿真场景技术”,可以模拟现实中不太常见的“边缘场景”用于无人驾驶培训。在仿真场景中,特斯拉工程师能够给大家提供不同的环境和其他参数(障碍物、碰撞、舒适度等),极大提升了训练效率。

  由此,特斯拉FSD系统已能轻松实现每1.5毫秒2500次搜索的超高效率,预测也许会出现的各种情况,并在其中找到最安全、最舒适、最快速的无人驾驶路径。

  随着所需处理的数据开始指数级增长,特斯拉也在提高训练神经网络的算力,因此,便有了特斯拉Dojo超级计算机。组成Dojo超级计算机的关键单元,是特斯拉自主研发的神经网络训练芯片——D1芯片。D1芯片采用分布式结构和7纳米工艺,搭载500亿个晶体管、354个训练节点,仅内部的电路就长达17.7公里,实现了超强算力和超高带宽。

  Dojo超级计算机的单个训练模块由25个D1芯片组成。由于每个D1芯片之间都是无缝连接在一起,相邻芯片之间的延迟极低,训练模块最大限度上实现了带宽的保留,配合特斯拉自创的高带宽、低延迟的连接器;在不到1立方英尺的体积下,算力高达9PFLOPs(9千万亿次),I/O带宽高达36TB/s。

  至此,特斯拉已经为Tesla Bot量身打造了最底层的FSD技术和Dojo超级计算机平台,只等Optimus的诞生了。马斯克还补充:“未来劳动力不会短缺,但体力劳动只是一种选择。Tesla Bot可以执行一些危险性、重复性、枯燥的任务。”

  时隔1年,即2022年9月30日,首款人形机器人原型机擎天柱(Optimus Gen-1)在AI Day上正式亮相。现场演示为原型机行走打招呼,视频演示为办公室浇植、工厂拿取结构件、识别周围物体渲染图等。

  Optimus Gen-1搭载2.3kWh容量电池,并采用集成式的设计,可提供52V电压。全身有28个关节,整个身体的自由度超过 200个,手掌设计部分通过六个致动器完成11个角度的自由动作,并能够举起超过20磅的物体。针对每个关节所需的力量/扭矩进行了仿线种专用电机,采用与特斯拉汽车电机同源的滚珠电机技术,能轻松实现各个关节的旋转和直线运动控制。

  Optimus Gen-1搭载了与特斯拉车辆相同的FSD技术和Autopilot相关神经网络技术,其大脑使用的是自研的AI训练 Dojo D1芯片和超级计算机 Dojo,在经过完全无人驾驶能力系统的实际应用验证后,特斯拉强大的FSD计算机视觉技术已可直接应用于机器人。

  通过搭载视觉相机,结合全身28关节执行器,以及底层FSD视觉算法和Dojo超级计算机提供算力支撑,Optimus Gen-1终于诞生。

  2023年3月:历时5个月开发,视频中显示人形机器人能实现独立的直立行走,且 能在另一台机器人上实现装配任务,手指关节可满足抓取电动工具、螺丝、覆盖在相框上的布等任务要求。

  Optimus 电机扭矩控制、力度控制更加精确灵敏;环境感知和记忆能力提升,不但可以看路,亦会记路;还可根据人类动作范例,进行端到端动作操控。

  2023年5月,FSD Beta已累计行驶接近2 亿英里。FSD能够应用在人形机器人,本质在于无人驾驶的模拟过程与机器人相同,即“输入-计算机平台-输出”。通过视觉系统识别周围环境,将数据传输至计算平台,平台将反馈传输给执行器等环节,产生动作。基于FSD的技术和数据积淀,构建核心竞争力,特斯拉 Optimus将拥有和其他机器人产品不同的智能化升级优势。

  Optimus 拥有了自我校准手臂和腿部的能力,仅使用视觉和关节位置编码器,它就可以在空间中精准定位自己的肢体。

  视觉感知能力提升明显,算法与模型慢慢的提升。机器人Optimus可通过视觉与关节位置编码器,在空间中精确定位四肢,能够自我校准手臂和腿,同时可自主按照颜色对物品进行筛选分类与排序,神经网络实现端到端训练学习。能够准确的看出特斯拉已经打通了FSD和机器人的底层模型,依赖神经网络模型和视觉技术,一直在优化FSD算法,在感知环境与自主分析做出运动方面表现较好,同时特斯拉Dojo平台有望逐渐增强机器人AI能力,特斯拉人形机器人量产有望加速。

  手部抓取与全身平衡表现亮眼,运动控制能力逐步提升。机器人Optimus可通过手指灵活抓取物品并放置指定位置,同时可做出类人的全身伸展运动,包括瑜伽单腿站立并保持平衡。

  2023 年 12 月 13 日,特斯拉发布第二代人形机器人 Optimus-Gen2 演示视频,对比一代机主要变化为:

  1)特斯拉采用自主设计的执行器和传感器,执行器中集成了电子部件,走路速度提升了30%。

  2)在机器人整体性能不下降的情况下,重量相比上一代人形机器人减重10kg。

  2)足部:仿真人足几何学设计,脚趾部分采用了铰接式的连接方式,使用力/扭矩传感器;

  3)手部:共11个自由度,手指搭配压力式触觉传感器,可精准抓握细小易碎品例如鸡蛋等;手指活动速度更快,还可以用拇指和食指两根手指从左手传递到右手,并且精准地拿起和放下鸡蛋。

  2)脚部做了类似人体结构的足弓设计,新增了脚趾关节,新增了脚部力/力矩感知功能。

  全新灵巧手设计,具备触觉感知能力。本次最新的进展视频中展示了特斯拉全新设计的灵巧手,具备更快的响应速度和11个自由度,手指上具备触觉传感器视频中演示了其双指将生鸡蛋轻拿轻放的能力。

  相比于第一代Optimus人形机器人,第二代Optimus在手指上新增了触觉传感器,触觉传感器能赋予机器人更精细的力反馈能力,有望提升人形机器人的工作上的能力,使其能完成更多任务,如精细的装配、柔性物体操作等。在更多传感器的加持下,机器人的应用场景有望进一步打开。

  Optimus人形机器人在硬件上实现升级换代,核心关节及零部件设计、整机协调控制等或均有大幅优化,机器人的灵活性控制能力明显提升。预计2024实现部分量产,2025年大规模进入工厂等场景使用。

  特斯拉人形机器人将兼具工业和家庭用途,能够执行工业生产里的复杂任务和家庭服务,最终实现劳动力替代。据高工机器人产业研究所,2026年全球人形机器人在服务机器人中的渗透率有望达到3.5%,市场规模超20亿美元,到 2030年,全球市场规模有望突破200亿美元。随人形机器人产品智能化程度不断的提高,远期市场空间更为广阔。马斯克认为,人形机器人可能比电动车业务做的更大,未来数量超越100亿-200亿台。

  文章出处:【微信号:阿宝1990,微信公众号:阿宝1990】欢迎添加关注!文章转载请注明出处。

  行业深度报告 /

  “夸父”通过OpenHarmony 3.2 Release版本兼容性测评

  有限公司(以下简称”深开鸿“)OpenHarmony生态建设能力和在新兴行业领域的

  创新实力,也标志着OpenHarmony在新兴行业领域又向前迈进了一步。 夸父

  为例分析,其感知交互系统自身硬件占总硬件成本的 8%。其中,力矩传感器、编码器、视觉传感、主芯片及 IMU 均有较高的硬件成本占比。

  各类传感器市场拆析 /

  揭秘 /

  擎天柱(Optimus)正式亮相,缓缓走出并和观众打了个招呼。在当时,在展示部分Optimus并没有做太多的动作演示。马斯克表示,“它还没有完全准备好走路,但我认为它会在几周

  “更像人类了” /

  首次亮相 , 需要人搀扶 ,无法正常工 作; 2023 年 3 月 :视频中显示

  【先楫HPM5361EVK开发板试用体验】(原创)6.手把手实战红外线传感器源代码