发布于 

LLM赋能的自主智能体(Agent)

原文:LLM Powered Autonomous Agents

以LLM(大型语言模型)作为核心控制器构建智能体的概念很酷。一些概念验证演示,如AutoGPT、GPT-Engineer和BabAGI,都是令人鼓舞的示例。LLM的潜力不仅限于生成书面副本、故事、论文和程序,它可以被视为强大的通用问题求解器。LLM驱动的自主智能体系统概述:LLM作为智能体的大脑,配合几个关键组件:子目标规划和分解、反思和改进、短期记忆、长期记忆和工具使用。该系统还包括记忆类型、最大内积搜索(MIPS)算法、工具使用能力的案例研究,以及AutoGPT等概念验证示例。

要点:

  • 建立以大型语言模型(LLM)为核心控制器的智能体系统是一个很酷的概念。
  • LLM的潜力不仅限于生成文本、故事、论文和程序,它还可以被视为一个强大的通用问题求解器。
  • 智能体系统的核心组成部分包括规划、反思、记忆和工具使用。
  • 规划:将复杂任务分解为可管理的子目标,实现对复杂任务的高效处理。
  • 反思和改进:智能体可以对过去的行动进行自我批评和反思,从错误中学习并改进,提高最终结果的质量。
  • 记忆:短期记忆用于模型的上下文学习,长期记忆通过外部向量存储和快速检索提供了无限的信息存储和回忆能力。
  • 工具使用:智能体学习调用外部API获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、专有信息源等。
  • LLM+P方法利用外部经典规划器进行长程规划,通过PDDL语言描述规划问题,将规划步骤外包给外部工具。
  • 自反思:智能体通过结合任务特定的离散动作和语言空间来进行自反思,从而改进决策和行动,提高推理能力。
  • CoH通过向模型提供过去输出的历史序列和反馈来改进模型的输出质量。
  • 算法蒸馏利用交叉轮次历史训练神经网络,学习强化学习算法的过程而非任务特定的策略。
  • 记忆分为感觉记忆、短期记忆和长期记忆,长期记忆可以通过外部向量存储和快速检索进行扩展。
  • 外部记忆通常使用最大内积搜索(MIPS)算法进行快速检索,常用的算法包括LSH、ANNOY、HNSW、FAISS和ScaNN。
  • 工具使用可以显著扩展模型的能力,如调用API、使用外部模块等。
  • MRKL是一个神经符号化架构,将LLM与多个专家模块结合起来,根据任务选择合适的模块。
  • HuggingGPT是一个使用LLM作为任务规划器的框架,根据模型描述选择合适的模型并提供执行结果的总结。
  • API-Bank是一个评估工具增强LLM性能的基准,包含常用API工具、完整的工具增强LLM流程和带有API调用的对话数据集。
  • ChemCrow是一个领域特定的示例,LLM与专家设计的工具结合,用于完成有机合成、药物发现和材料设计等任务。
  • Generative Agents是一个基于LLM的虚拟角色模拟实验,结合记忆、规划和反思机制,实现了智能体之间的互动行为。
  • AutoGPT是一个证明概念的示例,展示了将LLM作为主控制器的可能性,但在可靠性方面存在一些问题。