刚刚发布了下一代推理模型 o3 和 o3 mini。
在直播中,研究部高级副总裁 Mark Chen 展示了 o3 在某些基准测试中的表现,,例如竞赛数学(96.7%)和博士级科学(87.7%)。 OpenAI 和 ARC 竞赛还分享了 o3 如何在 ARC-AGI 基准测试中获得 76% 的成绩,其中包括新颖的未发布数据集。 ARC-AGI 基准测试旨在测试在每项新任务中即时学习新的独特技能的能力。
推文可能已被删除
该公告的上限为马拉松,每天都会推出新的东西。在过去的 12 个工作日内,OpenAI 推出了 AI 视频生成器, 视力与,除了一系列和旨在制作ChatGPT。
可混搭光速
o3 mini型号被设计为平衡性能的高性价比型号。它具有三种不同的努力级别,并根据问题的难度调整其推理时间量。 “令人难以置信的性价比提升,”首席执行官 Sam Altman 说道。
据OpenAI称,o3和o3 mini在智能方面取得了惊人的突破。但它们还没有准备好向公众发布。但 OpenAI 从今天开始允许早期访问 o3 和 o3 mini 进行安全测试。申请到加入模型测试计划滚动接受并于 1 月 10 日截止。