GitAgent是面壁智能联合清华大学自然语言处理实验室发布的一种可以自主扩展工具箱的大模型智能体应用框架。通过 GitAgent,大模型智能体可以从 GitHub 上扩展工具集合,以应对复杂任务需求。
GitAgent 的工具箱扩充过程包括搜索、配置、应用和存储四个阶段。
- 在搜索阶段,GitAgent 会在 GitHub 上搜索适合用户需求的仓库,并判断仓库是否能用来解决问题。
- 在配置阶段,GitAgent 会根据仓库的 README 文件执行配置命令,还可以通过学习人类经验来解决问题。
- 在应用阶段,GitAgent 使用配置好的仓库来解决用户需求,如果仓库没有清晰的使用入口,GitAgent 还可以通过学习人类经验来解决问题。
- 在存储阶段,GitAgent 将配置好的仓库及其执行环境存储下来,以便未来使用。
研究团队通过案例展示了 GitAgent 的应用,包括 Qlib 搜索、Bringing-Old-Photos-Back-to-Life 配置和 Sniffles 应用。通过 GitAgent,可以灵活选择不同的搜索策略,并能够熟练处理配置和应用阶段中的各种问题。
GitAgent 的发布拓展了大模型智能体的能力边界,使其可以自主扩展工具箱,从而更好地应对复杂任务需求。这一研究成果有望推动大模型智能体技术的发展,帮助人类实现更加多样更加复杂的任务需求。
论文地址: https://arxiv.org/abs/2312.17294