HyperAIHyperAI

Command Palette

Search for a command to run...

机器人世界模型:用于机器人鲁棒策略优化的神经网络模拟器

Chenhao Li Andreas Krause Marco Hutter

Abstract

学习鲁棒且具有泛化能力的世界模型,对于实现在真实环境中高效、可扩展的机器人控制至关重要。本文提出一种新颖的框架,用于学习能够准确捕捉复杂、部分可观测且具有随机性的动态行为的世界模型。所提出的方法采用双自回归机制与自监督训练策略,在无需依赖特定领域归纳偏置的前提下,实现了可靠的长时程预测,从而确保在多种机器人任务间具备良好的适应性。此外,我们进一步设计了一种策略优化框架,利用世界模型在虚拟环境中高效训练,并实现向真实系统中的无缝部署。本研究通过解决长时程预测、误差累积以及“仿真到现实”迁移等关键挑战,推动了基于模型的强化学习的发展。所提出的可扩展且鲁棒的框架,为真实应用场景中自适应、高效的机器人系统奠定了坚实基础。


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供