李飞飞团队最新s1模型，基于阿里云Qwen基模监督微调而成

fengjun 热点 6小时前 4

近日，李飞飞团队提出了一种模型训练新方法引发热议，他们以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座，在16块H100 GPU上监督微调26分钟，训练出新模型s1-32B，取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果，甚至在竞赛数学问题上的表现比 o1-preview 高出27%。

更早之前，DeepSeek官方曾透露，将DeepSeek-R1的推理能力蒸馏6个模型开源给社区，其中4个模型来自Qwen：基于Qwen-32B蒸馏的模型，在多项能力上实现了对标OpenAI o1-mini的效果。

喜欢 (0)

李飞飞团队最新s1模型，基于阿里云Qwen基模监督微调而成

钉钉AI助理接入DeepSeek

奇瑞分体式飞行汽车专利公布，可提高降落效率

最新文章

中国主导身体，英伟达要做大脑，特斯拉“做整合”——大摩详解人形机器人100强公司！

比亚迪智驾概念火热！港股黑芝麻智能盘中飙升55%，创上市新高

39元下载软件?上万元教本地部署？谁在利用DeepSeek“信息差”牟利

挑战最快AI助手！这款聊天机器人每秒能响应1000个tokens

九强生物：取得两项医疗器械注册证书

烽火通信：旗下长江计算实现DeepSeek系列模型的推理适配和优化

因造谣东方甄选贵州直播收宣传费，抖音用户被判赔偿3.6万元

烽火通信推动DeepSeek本地化部署

机构：2024年AI PC未能提振笔记本电脑市场，仅较2023年低点增长5%

25岁程序员可修改 6万亿美元数据马斯克DOGE小将黑料曝光

标签

关注我们么么哒！

李飞飞团队最新s1模型，基于阿里云Qwen基模监督微调而成

钉钉AI助理接入DeepSeek

奇瑞分体式飞行汽车专利公布，可提高降落效率

猜你喜欢

中国主导身体，英伟达要做大脑，特斯拉“做整合”——大摩详解人形机器人100强公司！

比亚迪智驾概念火热！港股黑芝麻智能盘中飙升55%，创上市新高

云计算厂商争夺中国出海企业

阿里巴巴公布图生视频专利，可实现智能化端到端图生视频

空客直升机2024年订单量同比增近10%

突然大量出现！有人几天收入超5万元，事关DeepSeek

三大运营商午后异动 中国联通直线飙升6%

大增614%！DeepSeek网站用户数量已超过谷歌Gemini聊天AI

OpenAI旧人集结！前联合创始人或加入前首席技术官初创公司

华为AI模型量化相关专利公布，可减少模型占用内存

雷军称正研究提升小米汽车产能

2025年或将出现一波AI硬件创业浪潮

最新文章

中国主导身体，英伟达要做大脑，特斯拉“做整合”——大摩详解人形机器人100强公司！

标签

关注我们 么么哒！

关注我们的公众号

三大运营商午后异动中国联通直线飙升6%

关注我们么么哒！