OpenAI o1: 慢思考的价值-Yichengr

OpenAI 发布了 o1 (Strawberry)。

System 1 vs System 2

它引入了类似人类 System 2 的慢思考机制。在给出答案之前，它会先进行 Chain of Thought (CoT)，自我反思，尝试不同的路径，然后再输出。

我试着用它写了一个非常复杂的C++模板元编程。以前用 GPT-4o，往往需要来回修好几次 bug。但 o1 在思考了 30 秒后，给出的一版代码竟然直接能跑通，而且考虑到了很多 edge cases。

虽然等待的那几十秒很痛苦，但考虑到它节省下来的 debug 时间，这完全是值得的。

AI 从“张口就来”进化到了“深思熟虑”，这可能比单纯提升参数量更可怕。