首个AI高考全卷评测结果发布：最高分303，数学全不及格

发布时间: 2024-6-22 13:23| 发布者: wangjing| 查看: 49611| 评论: 0

摘要: 据媒体报道，上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。在满分420分的三科测试中，阿里通义千问2-72B以303分的 ...

据媒体报导，上海野生智能尝试室旗下司北评测系统OpenCompass拔取了7个年夜模子停止下考“语数中”齐卷才能测试。OpenCompass公布了尾个年夜模子下考齐卷评测成果。

正在谦分420分的三科测试中，阿里通义千问2-72B以303分的成就拔得头筹，松随厥后的是OpenAI的GPT-4o，得到296分，而上海野生智能尝试室的墨客·浦语2.0位列第三。

尾个AI下考齐卷评测成果公布：最下分303 数教齐没有合格

那三年夜模子的得分率均超越了70%，展示了没有雅的气力。比拟之下，去自法国年夜模子草创公司的Mistral则排名开端。

到场此次评测的模子滥觞普遍，包罗阿里巴巴、整一万物、智谱AI、上海野生智能尝试室、法国Mistral的开源模子，和OpenAI的闭源模子GPT-4o。

尾个AI下考齐卷评测成果公布：最下分303 数教齐没有合格

为确保公允，尝试室出格指出，因为没法肯定闭源模子的更新工夫，评测中仅将GPT-4o做为参考，并已归入商用闭源模子。同时，一切到场评测的模子均正在下考前（2024年4月-6月）开源，有用制止了“刷题风险”。

从评测成果去看，年夜模子正在语文战英语圆里的表示遍及较好，但正在数教圆里则遍及没有合格。最下分仅为75分，由墨客·浦语2.0得到，松随厥后的是GPT-4o的73分。语文圆里，通义千问表示超卓，而英语则由GPT-4o发跑。

数教成就的不睬念凸隐出年夜模子正在庞大推理才能圆里的不敷。那一才能是金融、产业等请求牢靠场景降天所需的枢纽才能，也是年夜模子将来开展的主要标的目的。

尾个AI下考齐卷评测成果公布：最下分303 数教齐没有合格

1、转载或引用本网站内容须注明原网址，并标明本网站网址(https://www.wnceo.com)。

2、本网站部分投稿来源于“网友”，文章内容请反复甄别。若涉及侵权请移步网站底部问题反馈进行反映。

3、对于不当转载或引用本网站内容而引起的民事纷争、行政处理或其他损失，本网站不承担责任。

4、对不遵守本声明或其他违法、恶意使用本网站内容者，本网站保留追究其法律责任的权利。

收藏分享邀请

上一篇：美国AI圈震动！ “OpenAI宫斗”核心人物苏茨克维官宣创业下一篇：中国气象局发布三个AI气象大模型系统：命名风清、风雷、风顺

关注世界总裁网

扫描关注,了解最新资讯

实时了解财经信息

掌握市场风云动态

助力商场共赢至胜

改变你所看到的世界

资讯幻灯片

热门资讯

07-17

wangjing

全球首个可变形个人机器人，上纬新材启元T1

上纬新材今日官宣，全球首个可变形个人机器人 —— 启元 T，正式登场。据介绍，上纬新
07-17

wangjing

超越Opus 4.7美国顶级大模型 Kimi K3即将发

这个月会有多款国产重量级大模型发布，除了DeepSeek V4正式版之外，最受关注的当属月
07-17

wangjing

澳大利亚将推出其人工智能标准并在政府内设

澳大利亚联邦政府当地时间今日宣布将推出其人工智能标准并在总理和内阁部内设立人工智
07-17

wangjing

Mistral首席执行官Mensch：法国凭平价电力

据外媒 POLITICO 当地时间本月 12 日报道，法国人工智能初创企业 Mistral AI 首席执行
07-17

wangjing

诺基亚与英伟达推出行业首个商用AI-RAN平台

芬兰网络设备制造商诺基亚表示，公司已与英伟达共同开发出全球首个商用人工智能驱动的
07-17

wangjing

谷歌Google Vids新增数字分身功能：你也可

7 月 17 日消息，当地时间 16 日，谷歌宣布为 Google Vids 加入个人数字分身功能，用
07-17

wangjing

世界人工智能大会来了：这里有全球AI浪潮里

整齐的展台已然就位，屏幕上光影跃动。7月17日，2026世界人工智能大会暨人工智能全球
07-17

wangjing

Cloudflare推出Precursor：一键导入，持续

7 月 16 日消息，互联网基础服务企业 Cloudflare 当地时间本月 13 日宣布推出持续行为
07-17

wangjing

苹果AI有啥用？Apple Intelligence这些功能

等了两年，国行苹果AI终于要来了。7月15日，网信办发布公告，"Apple智能"正式完成备案
07-17

wangjing

OpenAI前女CTO创业发布首款AI模型：借鉴中

穆拉蒂凤凰网科技讯北京时间7月16日，据《华尔街日报》报道，OpenAI前首席技术官米拉

热门专题

全球首个可变形个人机器人，上纬新材启元T1

超越Opus 4.7美国顶级大模型 Kimi K3即将发

澳大利亚将推出其人工智能标准并在政府内设

Mistral首席执行官Mensch：法国凭平价电力

诺基亚与英伟达推出行业首个商用AI-RAN平台

谷歌Google Vids新增数字分身功能：你也可

排行榜

首个AI高考全卷评测结果发布：最高分303，数学全不及格

相关阅读

关注世界总裁网