OpenAI 发布了 o1 (Strawberry)。
System 1 vs System 2
它引入了类似人类 System 2 的慢思考机制。在给出答案之前,它会先进行 Chain of Thought (CoT),自我反思,尝试不同的路径,然后再输出。
我试着用它写了一个非常复杂的C++模板元编程。以前用 GPT-4o,往往需要来回修好几次 bug。但 o1 在思考了 30 秒后,给出的一版代码竟然直接能跑通,而且考虑到了很多 edge cases。
虽然等待的那几十秒很痛苦,但考虑到它节省下来的 debug 时间,这完全是值得的。
AI 从“张口就来”进化到了“深思熟虑”,这可能比单纯提升参数量更可怕。