HyperAIHyperAI

Command Palette

Search for a command to run...

5 个月前
Agent
LLM
基准

AWorld:具有稳定机动性的动态多Agent系统,用于鲁棒的GAIA问题求解

Zhitian Xie Qintong Wu Chengyue Yu Chenyi Zhuang Jinjie Gu

Abstract

大型语言模型(LLMs)的迅猛发展,使智能代理能够利用多种外部工具来解决复杂的现实世界问题。然而,随着代理对多种工具的依赖日益加深,也面临新的挑战:来自异构数据源的长上下文信息,以及噪声或无关的工具输出,均可能削弱系统的可靠性与准确性。这些挑战凸显了提升基于代理系统稳定性的迫切需求。为此,我们提出动态监督与调控机制,在AWorld框架内构建了一个稳健且动态的多智能体系统(MAS)架构。在我们的方法中,执行代理在关键步骤调用守护代理,对推理过程进行验证与修正,有效降低了由噪声引发的错误,显著增强了问题求解的鲁棒性。在GAIA测试数据集上的大量实验表明,所提出的动态调控机制显著提升了解决方案的有效性与稳定性,优于单智能体系统(SAS)及标准的工具增强型系统。最终,我们的动态多智能体系统在享有盛誉的GAIA排行榜中,成为开源项目中的第一名。这些成果充分体现了协作式智能体角色在构建更可靠、更可信的智能系统方面的实际价值。


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供