Bitcoin86.com

DeepMind:AICo-Mathematician在最难数学评测中登顶

币界网消息,谷歌DeepMind发布的AI Co-Mathematician在目前最难的研究级数学基准FrontierMath Tier 4上取得了47.9%的正确率,解出23道题,直接超过了此前最高纪录GPT-5.5 Pro的39.6%。该系统使用Gemini 3.1 Pro,没有采用新一代底座。通过多层架构,项目协调人将研究任务拆分成多条工作流,分发给不同的子agent进行文献检索、写代码和推理。最终,系统不仅登顶,还解出了3道此前所有模型未能解决的题目。AI Co-Mathematician目前仅对少量数学家开放内测。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。