5 个月前

Runnan Fang Yuan Liang Xiaobin Wang Jialong Wu Shuofei Qiao et al

Abstract

基于大型语言模型（LLMs）的智能体在多种任务中表现出色，但其程序化记忆往往脆弱，通常依赖人工设计，或与静态参数纠缠在一起。在本研究中，我们探索了赋予智能体可学习、可更新且具备终身记忆能力的程序化记忆的策略。我们提出了Memp方法，该方法将智能体过往的行为轨迹提炼为细粒度的、逐步骤的指令，以及更高层次的、类似脚本的抽象表示，并系统研究了程序化记忆在构建（Build）、检索（Retrieval）与更新（Update）三个环节中不同策略的影响。结合一种动态机制，该记忆库能够持续地更新、修正并淘汰过时内容，从而与智能体的新经验同步演化。在TravelPlanner和ALFWorld两个基准任务上的实证评估表明，随着记忆库的不断优化，智能体在相似任务上的成功率和执行效率均稳步提升。此外，由更强模型生成的程序化记忆具有持久价值：即使将该记忆迁移至性能较弱的模型，仍能带来显著的性能提升。

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding

Ready-to-use GPUs

Best Pricing

Get Started View Pricing

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

5 个月前

Runnan Fang Yuan Liang Xiaobin Wang Jialong Wu Shuofei Qiao et al

Abstract

基于大型语言模型（LLMs）的智能体在多种任务中表现出色，但其程序化记忆往往脆弱，通常依赖人工设计，或与静态参数纠缠在一起。在本研究中，我们探索了赋予智能体可学习、可更新且具备终身记忆能力的程序化记忆的策略。我们提出了Memp方法，该方法将智能体过往的行为轨迹提炼为细粒度的、逐步骤的指令，以及更高层次的、类似脚本的抽象表示，并系统研究了程序化记忆在构建（Build）、检索（Retrieval）与更新（Update）三个环节中不同策略的影响。结合一种动态机制，该记忆库能够持续地更新、修正并淘汰过时内容，从而与智能体的新经验同步演化。在TravelPlanner和ALFWorld两个基准任务上的实证评估表明，随着记忆库的不断优化，智能体在相似任务上的成功率和执行效率均稳步提升。此外，由更强模型生成的程序化记忆具有持久价值：即使将该记忆迁移至性能较弱的模型，仍能带来显著的性能提升。

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding

Ready-to-use GPUs

Best Pricing

Get Started View Pricing

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供