首个AI高考全卷评测结果发布：最高分303 数学全不及格

fengjun 热点 2024-06-19 120

《科创板日报》19日讯，上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分，此次高考测试结果显示，阿里通义千问2-72B排名第一，为303分，OpenAI的GPT-4o排名第二，得分296分，上海人工智能实验室的书生·浦语2.0排名第三，三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。从结果来看，大模型的语文、英语考试水平普遍不错，但数学都不及格，最高分也只有75分。

喜欢 (0)

首个AI高考全卷评测结果发布：最高分303 数学全不及格

比亚迪：某车企使用黑公关贬低、拉踩和恶意诋毁比亚迪，征集有效线索最高奖励500万

博世寻求通过合作与并购填补软件和人工智能领域的空白

最新文章

中颖电子第二总部基地在合肥高新区启用，总投资约4.5亿元

5000亿美元“星际之门”遭马斯克“拆台”，奥尔特曼回怼；OpenAI计划本周发布ChatGPT新功能丨全球科技早参

马斯克称软银等公司“缺乏足够资金”兑现在美AI投资承诺，OpenAI奥特曼回击

微软业务发展执行副总裁克里斯托弗·杨辞职

SK海力士计划今年增加HBM3E供应量并适时开发出HBM4

新型锂硫电池突破高能和寿命“瓶颈”

中长期资金入市！中国资本市场迎来重磅方案

人类基因组完整改组图谱绘成

5000亿美元“星际之门”？马斯克：OpenAI没钱，软银也不到100亿美元！奥尔特曼：来现场看

古特雷斯：气候变化和人工智能无序扩张威胁人类生存发展

标签

关注我们么么哒！

首个AI高考全卷评测结果发布：最高分303 数学全不及格

比亚迪：某车企使用黑公关贬低、拉踩和恶意诋毁比亚迪 ，征集有效线索最高奖励500万

博世寻求通过合作与并购填补软件和人工智能领域的空白

猜你喜欢

月之暗面发布k1.5多模态思考模型

阿里云通义开源首个多模态推理模型QVQ

Kimi发布视觉思考模型k1，“数理化”成绩领先OpenAI o1

金融领域大模型年度评测报告出炉 阶跃星辰/财跃星辰大模型表现优秀

联手微软拓展AIPC智能教育生态 豆神教育还有其他“大动作”

Kimi发布新一代推理模型，数学能力对标OpenAI o1系列

每日经济新闻大模型年度评测报告

“姜萍事件”调查结果出炉，阿里巴巴：老师提供帮助，数学竞赛违反预选赛规则

英博数科先进算力实验室正式成立

五大维度评测OpenAI全新o1模型：代码编写、游戏制作等能力“惊艳”，事实性知识却“翻了车”

OpenAI发布具有推理能力的人工智能模型o1

每日经济新闻大模型评测报告（第2期）：国产“黑马”逆袭，计算能力差成通病

最新文章

中颖电子第二总部基地在合肥高新区启用，总投资约4.5亿元

标签

关注我们 么么哒！

关注我们的公众号

比亚迪：某车企使用黑公关贬低、拉踩和恶意诋毁比亚迪，征集有效线索最高奖励500万

金融领域大模型年度评测报告出炉阶跃星辰/财跃星辰大模型表现优秀

联手微软拓展AIPC智能教育生态豆神教育还有其他“大动作”

关注我们么么哒！