近日,大模型开放评测体系司南(OpenCompass)推出评测指标G-Pass@k及数学评测集LiveMathBench,旨在检验大模型的数学推理能力,加速大模型在高难度推理场景中的落地应用。 ...
12月25日,阿里云通义千问发布首个开源多模态推理模型QVQ-72B-Preview。QVQ展现出超预期的视觉理解和推理能力,在解决数学、物理、科学等领域的复杂推理问题上表现尤为突出。 ...
财联社12月21日讯(编辑 潇湘)OpenAI将其最为重要的尖端产品,放在了为期12天的技术分享直播活动的最后一天! 周五,OpenAI发布了下一代的推理模型o3,这是今年早些时候发布的o1推理模型的 ...
12月16日,Kimi发布视觉思考模型k1,在最新版App和Web端上线。 ...

关注我们的公众号

微信公众号