这篇人工智能论文介绍了代理:用于自治语言代理的开源 Python 框架



屏幕截图 2023 年 09 月 17 日凌晨 3.32.26屏幕截图 2023 年 09 月 17 日凌晨 3.32.26

在客户服务、咨询、编程、写作、教学等任务中,语言代理可以减少人类的工作量,是迈向通用人工智能 (AGI) 的潜在第一步。最近展示的语言代理潜力(包括 AutoGPT 和 BabyAGI)引起了研究人员、开发人员和普通观众的广泛关注。 

即使对于经验丰富的开发人员或研究人员来说,大多数演示或存储库也不利于定制、配置和部署新代理。这种限制是由于这些演示通常是强调语言代理潜力的概念验证,而不是可用于逐步开发和定制语言代理的更实质性的框架。 

此外,研究表明,大多数开源资源仅涵盖基本语言代理能力的一小部分,例如工作分解、长期记忆、网络导航、工具使用和多代理通信。此外,目前使用的大多数(如果不是全部)语言代理框架完全依赖于简短的任务描述,并且完全依赖于法学硕士的计划和行动能力。由于不同运行之间的高度随机性和一致性,语言代理很难修改和调整,用户体验很差。

来自 AIWaves Inc.、浙江大学和苏黎世联邦理工学院的研究人员推出了 AGENTS,这是一个开源语言代理库和框架,用于支持 LLM 驱动的语言代理。 AGENTS 的目标是使语言代理的定制、调整和部署尽可能简单(即使对于非专家而言),同时又易于程序员和研究人员扩展。该库还提供下面列出的核心功能,这些功能结合起来使其成为语言代理的灵活平台: 

长短期记忆: AGENTS 合并了记忆组件,允许语言代理定期使用暂存器更新短期工作记忆,并使用 VectorDB 和语义搜索存储和检索长期记忆。用户只需填写配置文件中的字段即可决定是否为代理提供长期记忆、短期记忆或两者。 

网页导航和工具的使用: 自主代理使用外部工具和浏览互联网的能力是另一个关键特征。 AGENTS 支持一些广泛使用的外部 API,并提供一个抽象类,使程序员可以轻松地合并其他工具。通过将网络搜索和导航分类为专门的 API,我们还使代理能够浏览互联网和收集信息。 

多智能体交互: AGENTS 允许可定制的多代理系统和单代理功能,这对于游戏、社交实验、软件开发等特定应用可能很有用。AGENTS 中的“动态调度”功能是多代理通信的一项新功能。动态调度允许建立一个充当“主持人”的控制器代理,并根据其角色和最近的历史记录选择哪个代理执行下一步操作,而不是按照硬编码规则安排代理的操作顺序。当使用动态调度时,多个代理之间存在更灵活和自然的通信的可能性。通过使用简单的语言在配置文件中定义控制器的规则,开发人员可以快速更改控制器的行为。 

人机交互 AGENTS 在单代理和多代理场景中都支持,从而实现一个或多个人类与语言代理之间的交互和通信。

可控性:使用通常称为标准操作程序 (SOP) 的象征性计划,代理为开发可控代理提供了革命性的范例。 SOP 是具有多个状态的图,描述了代理在执行任务时可能面临的各种情况以及状态之间转换的规则。 AGENTS 中的 SOP 是精心记录的详细说明的集合,指定代理或代理组应如何执行特定活动或程序。这与现实世界中的 SOP 类似。 LLM 可以生成用户可以在个性化和微调代理时更改的 SOP。部署后,代理将按照为每个状态规定的指令和标准运行,并动态更改其当前状态以响应与外界、人员或其他代理的交互。随着符号计划的出现,现在可以对代理的行为提供细粒度的控制,提高其稳定性和可预测性,同时促进调整和代理优化。

该团队希望 AGENTS 能够让研究人员更轻松地研究语言代理,让开发人员更轻松地利用语言代理创建应用程序,并使非技术受众更轻松地创建和修改独特的语言代理。 


查看  和 吉图布这项研究的所有功劳都归功于该项目的研究人员。另外,别忘了加入 我们的 30k+ ML SubReddit, 40k+ Facebook 社区, 不和谐频道, 和 电子邮件通讯,我们在这里分享最新的人工智能研究新闻、酷炫的人工智能项目等等。

如果您喜欢我们的工作,您一定会喜欢我们的时事通讯。

这篇人工智能论文介绍代理:用于自主语言代理的开源 Python 框架首先出现在 MarkTechPost 上。



来源链接

发表评论

您的电子邮件地址不会被公开。 必需的地方已做标记 *

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

zh_CNChinese