我们的具身智能研究聚焦于智能如何由智能体的物理躯体与其控制系统之间的交互而涌现。我们开发能够利用这种物理具身性的 AI 方法,以提升在不断变化环境中的适应能力,从而构建更强健、响应更迅捷的自主系统。
本工作提出解析任务调度器(ATS),一种面向具身基础模型的持续学习新框架。ATS 包含一个任务专用模型库,其中每个模型均独立地在单一任务上微调;并配备一个以递归最小二乘(RLS)训练的解析调度器,用于学习语言指令与任务专用模型之间的映射。我们在真实机器人平台 RM65B 上验证了 ATS,实验表明其具有卓越的抗遗忘能力与对任务变化的强大适应性。
Analytic Task Scheduler
我们在具身抓取系统中采用多智能体架构完成环境感知、复杂任务分解以及全过程反思;各智能体通过共享记忆库进行 token 预测。为了贴合人类意图,我们设计了一种双智能体闭环,将抓取成功率相比当前最优方法提升 25%,并把每个智能体的 token 输出嵌入潜在空间,以实现协同优化。

← 返回