阿尔特曼爆猛料:超快推理模型o3-mini预计几周内上线,GPT系列或与o系列合并!专家猜测GPT-5也许永远不会公开发布
当地时间1月17日,OpenAI CEO阿尔特曼又在X上放出旗下产品的最新消息。
据他透露,最新的o3-mini推理模型预计将在几周内正式推出。他强调,o3-mini的表现“非常出色”。除此之外,阿尔特曼在回网友提问时表示,希望在2025年将GPT系列和o系列合并。也许,一个结合GPT系列的强大语言理解能力和o系列的快速推理能力的强大AI模型将在2025年诞生。
至于最受公众期待的GPT-5相关问题,阿尔特曼没有给出具体的时间表和性能指标,只是表示“仍在确定中,但我认为你们会满意的”。
AI专栏作家Alberto Romero在个人博客里猜测GPT-5可能早就开发好了,但OpenAI或许参考了竞争对手Anthropic的做法,将其用于模型蒸馏,以提升其他功能稍差、价格更便宜的模型的性能。他认为,GPT-5或许永远也不会对外发布了。
阿尔特曼爆猛料:最新o3-mini模型将于几周内推出,GPT系列或与o系列合并
当地时间1月17日,阿尔特曼在X上透露了一系列关于OpenAI新模型开发和发布的消息。
阿尔特曼在推文中感谢了外部安全研究人员对最新o3-mini模型的测试,然后称,o3-mini的最终版本已经确定,并进入发布流程,计划将在几周内正式推出。同时,针对之前的反馈意见,API和ChatGPT版本将同步发布。阿尔特曼还特别强调,o3-mini的表现“非常棒”。
图片来源:X
在这条推文下,阿尔特曼还回答了许多网友关心的问题。
比如,有网友问:即将推出的o3-mini和o1 pro相比,谁更强?对此,阿尔特曼表示,o3-mini在大多数方面比o1 pro要差一些,但其最大优势在于速度极快。o3-mini是一个专注于推理速度和效率的模型,适合对响应时间要求较高的应用场景。
图片来源:X
阿尔特曼明确表示,o3-mini的消息速率“非常高”。Plus用户届时可以使用。而且,据他透露,OpenAI也在计划推出更智能的o3模型,o3 pro的订阅费为一个月200美元。
专家猜测GPT-5早已开发完成,或被用于内部模型蒸馏
关于GPT系列的未来,阿尔特曼表示,“希望在2025年将GPT系列和o系列合并。”如果他的想法实现,那外界有望在今年见到一个融合GPT系列的强大语言理解能力和o系列快速推理能力的强大AI模型。
当被问及关于GPT-5的发布时间和性能表现时,阿尔特曼表示:“仍在确定中,但我认为你们会开心的。”阿尔特曼的回答耐人寻味,或许GPT-5的发布流程也很快将被提上日程。
图片来源:X
此前有人猜测,GPT-5的内部开发已经完成,只是回报率不够高,远没有内部使用来的好处大,比如用于模型蒸馏。
当地时间1月17日,AI专栏作家Alberto Romero在个人博客上发表了一篇关于GPT-5的深度分析文章,他通过一系列推理分析提出一个令人震惊的猜测:“OpenAI很可能已经开发出了GPT-5,但选择将其内部保留,而不是公开发布。”并且,OpenAI或许不会很快发布GPT-5,除非还有更好的模型(GPT-6)被训练出来。
Romero的证据来自OpenAI的最大竞争对手Anthropic。2024年10月,业界普遍预期Anthropic会发布3.5 Opus作为对GPT-4o的回应,但出人意料的是,该公司只更新了Claude 3.5 Sonnet版本。次月,彭博社报道称,3.5 Opus训练后表现虽优于旧版,但因模型大小及成本,优势未达预期。Anthropic之所以不推出3.5 Opus,是因为成本和性能并不匹配,虽然3.5 Opus训练未失败,但结果不佳。
2024年12月,半导体专家Dylan Patel及其团队称,Anthropic实际上已经完成Claude 3.5 Opus训练且表现良好。未发布的原因是,Anthropic使用Claude 3.5 Opus来生成合成数据并进行奖励建模,Claude 3.5 Sonnet更新版本就是奖励建模的成果。
使用功能强大、价格昂贵的模型来生成数据,从而提升功能稍差、价格更便宜的模型的性能,这一过程被称为蒸馏。这是一种常见的做法。此前在国内引起轰动的DeepSeek-V3模型也使用了这一方法。
Dylan表示,Anthropic选择不发布3.5 Opus,因为它在内部更有价值。这也就是开源社区如此迅速赶上GPT-4的原因,他们直接从OpenAI的矿山中获取黄金。
Romero认为,OpenAI可能也在采用类似的方法处理GPT-5。由于最新的模型不仅性能更好,而且比上一代更小、更便宜,OpenAI可能也在通过蒸馏技术来提升其模型性能,同时控制成本。Romero称,也许这就是OpenAI在短短三个月内从o1跃升至o3的原因。
随着时间的推移,GPT-5需要达到的门槛不断提高,公众对于GPT-5的期待也越来越高。
华尔街日报对GPT-5的报道,与彭博社对3.5 Opus的评价几乎一致。“OpenAI意识到GPT-5比目前的产品表现更好,但还未好到足以证明维持(GPT-5)运行的巨大成本是合理的。”
Romero认为,OpenAI或许永远也不会推出GPT-5了,“现在对他们(指的是OpenAI)来说唯一重要的目标是,继续为下一代模型生成更好的数据。从现在开始,基础模型可能会在后台运行,使其他模型能够实现它们自己无法完成的壮举——就像一位老隐士从秘密的山洞中传授智慧,只不过这个山洞是一个巨大的数据中心。”