Bitcoin86.com

AA-Briefcase发布:ClaudeFable5夺冠,GLM-5.2挤进前三

币界网消息,AA-Briefcase发布称,Claude Fable 5在评测中夺冠,GLM-5.2则挤进前三。评测机构Artificial Analysis推出了首个专为大模型智能体设计的长周期知识工作评测基准,涵盖数据科学、产品管理、银行业务运营及重工业战略四个场景,由谷歌、麦肯锡和波士顿咨询的行业专家开发,共设有91项任务,旨在模拟真实复杂的商业项目流。结果显示,Claude Fable 5取得了最高综合评分,Claude Opus 4.8和GLM-5.2分列第二与第三位。尽管Claude Fable 5表现强劲,但在严格的单项任务全对标准下,完美率仅为3%。在开源模型方面,智谱GLM-5.2表现突出,综合评分仅比Claude Opus 4.8低90分,但运行成本不足其25%。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。