NVIDIA 和卡内基梅隆大学推出的一个专为人形机器人设计的框架:ASAP
它可以帮助机器人在模拟环境中学会动作后,能够准确地在真实世界中执行这些动作,这使得以前难以实现的高度灵活的动作成为可能!
该框架通过一个两阶段的过程,使得机器人可以在仿真环境中预先训练,之后将这些训练过的策略应用到真实世界中,并通过进一步的调整实现更加灵活的全身运动。
人形機器人具有無與倫比的多功能性,以執行類似人類的全身技能。但是,由於模擬與現實世界之間的動態不匹配,實現敏捷和協調的全身運動仍然是一個重大挑戰。現有的方法,例如係統識別(SYSID)和域隨機化方法(DR)方法,通常依賴於勞動密集型參數調整或導致過度保守的犧牲敏捷性的政策。在本文中,我們提出了盡快(對齊模擬和真實物理學),這是一個兩階段的框架,旨在解決動態不匹配並實現敏捷的人形全身技能。
在第一階段,我們使用重新定位的人類運動數據進行訓練運動跟踪策略。在第二階段,我們在現實世界中部署政策,並收集現實世界中的數據來訓練Delta(剩餘)動作模型,以補償動態不匹配。然後,與Delta Action模型的ASAP微調預先訓練的策略集成到模擬器中,以有效地與現實世界動力學對齊。我們在三種轉移方案中盡快評估了ISAACGYM到Isaacsim,Isaacgym到Genesis和Isaacgym,以及現實世界中的G1 Humoleoid Humoid Robot。與Sysid,DR和Delta Dynamics學習基準相比,我們的方法顯著改善了各種動態運動的敏捷性和全身協調,從而減少了跟踪誤差。
盡快實現了以前難以實現的高度敏捷運動,這表明了在橋接模擬和現實世界動態中的三角洲動作學習的潛力。這些結果表明,可以開發出更具表現力和敏捷的人形生物的有希望的SIM到真實方向。
ASAP框架內有四個步驟:
運動跟踪預訓練和實際軌跡集合:
通過人類視頻重新定位的人形動作,我們預先訓練了多個運動跟踪策略,以推出現實世界中的軌跡。
灌溉動作模型培訓
基於現實世界的推出數據,我們通過最大程度地減少模擬狀態s_t和現實世界狀態s^r_t之間的差異來訓練三角洲動作模型;
政策微調
我們凍結了三角洲動作模型,將其納入模擬器以對齊現實世界物理學,然後微調預訓練的運動跟踪策略;
現實世界的部署
最後,我們直接在沒有三角洲行動模型的情況下將微調策略部署在現實世界中。
地址:https://agile.human2humanoid.com/
论文:https://arxiv.org/pdf/2502.01143
油管:https://youtu.be/e5-RXaSyti0
留言
發佈留言