新华社研究院AI大模型体验报告出炉:讯飞星火“智商”居首位
(资料图)
500道题目、对标接受过高等教育的人类水平、更强调对产业和生活的实际价值,严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计……8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一,《报告》认为讯飞星火“在工作提效方面优势明显”。
《报告》认为,具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
面对国产大模型“涌现”,讯飞星火认知大模型从立项到发布,再到迭代升级,每个节点都紧锣密鼓:5月6日发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地;6月9日突破开放式问答,并在数学能力和多轮对话能力上迭代升级;即将到来的8月15日会在代码能力上实现重大突破,并在多模态交互能力上升级;10月24日对标ChatGPT,实现中文超越、英文相当的水平。
在智商评估方面,《报告》认为,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。
在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效(50%)和生成创新(50%)方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。
《报告》认为,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。
标签:
甘肃:“寒凉”持续盘踞 “甘味”农产备受考验
(上海战疫录)专访上海一居民区书记:坚持!背后6000多居民等着我们
西宁公安严厉打击涉疫违法犯罪 依法处理案件72起123人
甘肃渭源:千年渭水文化蕴“写生热” 校地合作塑学生文化涵养
5月16日起 西宁市部分区域有序开放
青海西宁:设置“黄码医院”保障重点人群医疗服务需求
- 08-14新华社研究院AI大模型体验报告出炉:讯飞星火“智商”居首位
- 08-14三星意外泄露了带有改进的快速面板的OneUI 6
- 08-14服务外包持续拓宽人才“蓄水池”
- 08-14室内泥鳅养殖方法是怎样的?注意事项有哪些?
- 08-14“数智”图书馆为读者带来“花式”体验
- 08-14我国首次将AI技术规模化用于输电线路发热检测
- 08-14钢铁行业周报:板螺盈利分化
- 08-14L‘OCCITANE(00973):媒体报导所载揣测发售价属虚假且并无依据 8月14日复牌
- 08-14伊媒:伊朗总统下令立即调查设拉子市恐袭事件,要求严惩凶手
- 08-14孚能科技:8月11日获融资买入1337.88万元,占当日流入资金比例8.72%
- 08-14竹门帘子(竹门楼)
- 08-14微信订阅号在哪里取消关注_微信订阅号在哪
- 08-14真三国无双4最强武器获取方式 真三国无双4全人物顶级武器获取方法
- 08-13嗔怪的意思(嗔怪)
- 08-138月14日10时 杭州亚运会体育比赛门票实时销售启动
- 08-13皮卡丘去吧是什么意思 去吧皮卡丘是什么梗
- 08-13地质灾害预警!辽宁吉林等地部分地区发生地质灾害气象风险较高
- 08-13外资稳中提质 促进经济高质量发展
- 08-13浙江打掉网络赌博团伙 涉赌资金1.2亿元
- 08-13英诺特:红杉智盛拟减持不超过2%股份
- 08-13史禄拼音怎么读?史禄的正确读音是什么?
- 08-13重估美团:外卖稳守基本盘,直播、即时零售提供新想象
- 08-13东北强降雨持续!新疆青海等地警惕暴雨灾害风险
- 08-13生态主题公益歌曲《好一幅百鹤图》正式发布
- 08-13GTA Online每周更新增加攻击直升机和新游戏模式
- 08-13黑龙江省将防汛二级应急响应调整至三级
- 08-13杰凡尼全铝家居(杰凡尼)
- 08-13华为怎么设置volte 华为手机volte设置
- 08-13大学录取通知书出错警示了什么
- 08-13cs75小毛病(2020款新cs75通病是什么?)