这两天 GitHub 上最火的项目莫过于 AutoGPT 了。在这个 LLM 狂飙的五月,大家都在谈论 Agent 的未来。
趁着周末,我也拉下来跑了一下。
什么是 AutoGPT?
简单来说,它给 GPT-4 装上了“手脚”(联网搜索、文件读写、代码执行),并且给它设定了一个核心循环:
- 思考:我要做什么?
- 计划:分几步走?
- 行动:执行命令。
- 反思:结果对不对?不对再来。
试玩过程
我给它下了一个指令:
“帮我调研一下目前市面上所有的开源向量数据库,对比它们的优缺点,并写一份 Markdown 报告保存在本地。”
看着终端里的一行行 log,确实很厉害:
- 它自己去 Google 搜 “vector database comparison 2023”
- 它点进了 Pinecone 和 Milvus 的官网
- 它发现内容太多,决定总结一下
- 它创建了一个
research.txt开始写草稿
但是! 这就好比看着一个实习生干活,虽然很努力,但效率极低。它经常陷入死循环:“我需要搜索 X -> 搜索指引我去看 Y -> 看 Y 发现需要搜索 Z -> 搜索 Z 发现还是需要搜索 X”。
结局
玩了大概半小时,我发现我的 OpenAI API 使用量暴涨了 15 刀。GPT-4 的 token 还是太贵了,尤其对于这种不知疲倦、一旦陷入死循环就疯狂消耗 token 的 Agent 来说。
赶紧 Ctrl+C 终止了进程。
AutoGPT 展示了 AGI 的一种雏形,但目前的推理能力和上下文长度限制了它的实用性。或许等 GPT-5 出来,或者 token 价格再降低 10 倍,Agent 时代才会真正到来。