HyperAIHyperAI

Command Palette

Search for a command to run...

5 个月前
Agent
LLM
基准

Memp:探索Agent程序记忆

Runnan Fang Yuan Liang Xiaobin Wang Jialong Wu Shuofei Qiao et al

Abstract

基于大型语言模型(LLMs)的智能体在多种任务中表现出色,但其程序化记忆往往脆弱,通常依赖人工设计,或与静态参数纠缠在一起。在本研究中,我们探索了赋予智能体可学习、可更新且具备终身记忆能力的程序化记忆的策略。我们提出了Memp方法,该方法将智能体过往的行为轨迹提炼为细粒度的、逐步骤的指令,以及更高层次的、类似脚本的抽象表示,并系统研究了程序化记忆在构建(Build)、检索(Retrieval)与更新(Update)三个环节中不同策略的影响。结合一种动态机制,该记忆库能够持续地更新、修正并淘汰过时内容,从而与智能体的新经验同步演化。在TravelPlanner和ALFWorld两个基准任务上的实证评估表明,随着记忆库的不断优化,智能体在相似任务上的成功率和执行效率均稳步提升。此外,由更强模型生成的程序化记忆具有持久价值:即使将该记忆迁移至性能较弱的模型,仍能带来显著的性能提升。


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供