Bitcoin86.com

AI姨:GPT-5.5在二进制重写程序挑战中取得满分

币界网消息,据链上分析师AI姨报道,GPT-5.5在200道「从二进制重写程序」难题中取得首个满分,成为首个成功攻破由meta fair、斯坦福和哈佛联合开发的programbench基准的模型。该基准仅提供编译好的二进制文件和文档,AI必须自行选择语言和架构,从零开始编写与原程序行为完全一致的代码。GPT-5.5在高推理模式下分别用C和Python编写了cmatrix(终端矩阵雨动画),两版均完美通过了全部行为测试,花费分别为3.17和4.84美元。相比之下,Claude Opus 4.7花费10.74美元,调用178次API,仍有19个测试未通过。推理强度对结果影响显著,GPT-5.5在默认推理下仅略优于Claude Sonnet 4.6,但在最高档下表现大幅领先其他模型。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。