兄弟们,完犊子了。
OpenAI 昨天凌晨放出 2 个新模型,一个 o3,一个 o4-mini。
主要就是有了 Thinking with images 图像思考能力。就是说,它们可以把图像整合到思维链中,作为推理的一部分。
听起来咋咋呼呼的,实际如何?
世超把一张 3 年前的照片发给 o3。
结果它只用了 7 分钟,就分析出我是在哪个城市哪个园区甚至哪条河旁边拍摄的。。。
不儿,你这开盒能力也太猛了。
去官网研究了一下资料,我发现这次 o3 能力大升级的背后,核心是“ 强化学习 ”这四个字。
OpenAI 发现和算力越大,AI性能越强的行业黄金法则一样,在强化学习中,给模型的思考时间越长,模型的能力也会越逆天。
按照这路子,他们直接让 AI 学会了咋用工具、并且推理啥时候该用什么工具。
所以这才有了 o3 不断放大图片,以像素级精度查看图片的每个角落,观察到普通人往往忽略的细节,再把所有获取到的信息放在网络上搜索——
足够多的信息量,足够长的时间,配合着足够强大的推理能力,就爆发出了这种恐怖如斯的效果。
虽然 o3 的出现,把 AI 进程又往前狠狠推动了一大步,但说实话世超也有点担心:
在 AI 能读懂照片的时代,我们的个人信息是不是更不好保护了?