97福利网_91免费视频在线_91国在线高清视频_91麻豆精品国产91久久久资源速度_国产网站久久_素人视频免费观看

频道 > 生活 >   >  正文

世界速递!五大模型解高考数学:阿里通义千问、360智脑10题全错得0分;讯飞星火答对一半

评论

一年一度高考季,高考试题是大众关注的焦点,也成为了AI能力的试金石。AI大模型数学功底到底如何?比人类“聪明”吗?搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。


(相关资料图)

在测试中,搜狐科技选取了高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。

测试结果显示,这五款大模型在答数学题的能力上差异显著。

最“聪明”的讯飞星火答对了5题,正确率50%。百度文心一言和ChatGPT“紧跟其后”,答对了4题,正确率为40%。

360智脑和通义千问则“全军覆没”,一道题也没答对,交了白卷。

值得一提的是,昨天搜狐科技也用五款大语言模型产品,对高考作文全国卷(甲)进行了测试,并邀请了5位语文名师打分。

打分结果显示,ChatGPT高考作文得分最高,文心一言、讯飞星火得分稍低,但跟ChatGPT处于同一水平。360智脑和通义千问得分最低。

虽然语文作文题和数学计算题,对大模型能力考察的维度并不尽相同。但巧合的是,不擅长写作文的360智脑和通义千问,似乎也不擅长做数学题。

通过这两次高考题测试,也能从侧面反应出各家大模型的能力确实是“参差不齐”。如果ChatGPT、文心一言、讯飞星火是“学霸”,那么360智脑和通义千问则是妥妥的“学渣”。

附测试中使用的高考数学题题目:

1.不等式|x-2|<1的解集为__

2.a=(2,3),b=(-1,2),则a·b=__

3.首项为3,公比为2的等比数列的前六项和S6=__

4.tanA=3,tan2A=__

5.f(x)={2^xx>0;1,x≤0}的值域为__

6.复数z=1-i,则|1+iz|=__

7.圆的方程x^2+y^2-4y-m=0的面积为π,则m=__

8.三角形的三边长为a=4,b=5,c=6,则sinA=__

9.某地一年四个季度的GDP(亿元),第一季度GDP为232,第四季度GDP为241,且四个季度的GDP逐季度增长,中位数、平均数相等。则该地一年的GDP为__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0,正数k的最大值为__

责任编辑:

标签:

今日热点

热点排行

最近更新

所刊载信息部分转载自互联网,并不代表本网赞同其观点和对其真实性负责。邮箱:[email protected]

联系我们| 中国品牌网 | 沪ICP备2022005074号-18 营业执照  Copyright © 2018@. All Rights Reserved.

主站蜘蛛池模板: 成人国产精品一区二区免费看 | www亚洲精品少妇裸乳一区二区 | www.四虎com| 精品一区二区三区自拍图片区 | 少妇被躁爽到高潮 | 青青草原国产在线 | 四虎影视在线看免费观看 | 亚洲av日韩综合一区在线观看 | 日韩久久网 | sao虎影院网站入口在线观看 | 久久夜靖品 | 99精品电影一区二区免费看 | 欧美精品久久久久久久久大尺度 | 天堂一区二区三区在线观看 | 欧美一级专区免费大片野外交 | 欧美xxxx色视频在线观看 | 男人打飞出精视频无码 | 又硬又粗又大一区二区三区视频 | 欧美日韩在线成人看片a | 两个人看的www | 美女一级牲交毛片视频 | 久久精品中文闷骚内射 | 日韩日韩| 伊人色综合一区二区三区影院视频 | 午夜视频免费在线 | 亚洲免费成人在线 | 久久久精品中文字幕乱码18 | 伊人久久精品亚洲午夜 | 伊人久久大香线蕉无码 | 一个人在线观看免费视频www | 免费一级特黄特色大片在线观看看 | 亚洲中文久久精品无码ww16 | 亚洲愉拍二区一区三区 | 看全色黄大色大片免费久久 | 久草免费资源站 | 亚洲精品毛片久久久久久久 | 国产精品久久久久久小说 | 国产高清a毛片在线看 | 红杏亚洲影院一区二区三区 | 天天撸日日夜夜 | 大学生久久香蕉国产线看观看 |