菲尔兹奖得主 Gowers 亲测 ChatGPT 5.5 Pro：推理仍有幻觉陷阱

菲尔兹奖得主 Gowers 亲测 ChatGPT 5.5 Pro

数学家 Timothy Gowers 在博客中详细记录了使用 ChatGPT 5.5 Pro 解数学题的全过程。他发现模型在推理链流畅度上有明显提升，但在复杂证明中仍会产生「看似合理但实际错误」的中间步骤——这种微妙幻觉比完全错误的输出更危险，因为更容易蒙蔽审查者。

对构建 AI Agent 的开发者来说，这再次验证了：LLM 作为推理引擎时，不能跳过独立验证层。

HN 604 分、428 条评论，成为当日最热帖。