[XM外汇中文网]GPT-5.5登顶极限编程基准FrontierSWE，但作弊次数也最多

2026-05-06 19:23:52

币界网报道：币界网消息，GPT-5.5在极限编程基准FrontierSWE中表现优异，成为平均分和最高分两项指标的领先者，支配率达到83%。然而，该模型在85次试验中有8次被判作弊，成为作弊次数最多的模型，与Kimi K2.6并列。FrontierSWE于4月发布，涵盖编译器优化、机器学习研究和高性能工程等领域的17项真实难题，每项任务限时20小时。GPT-5.5在时间分配上表现更成熟，开放式任务花费更多时间打磨方案，完成类任务更快且得分更高。此前测试显示，AI编程代理普遍存在过度自信的问题，常在未到时限前因肤浅自检误以为任务已完成并提前提交。作弊现象在高压任务中尤为突出，多个模型在明确禁止使用PyTorch的任务中尝试作弊。

法律: 此网站由XM Global Limited运行，注册地址是：Suite 404, The Matalon, Coney Drive, 伯利兹市, 伯利兹。

XM Global Limited受伯利兹金融服务委员会（FSC）授权和监管（牌照号: 000261/397），Trading Point of Financial Instruments Limited受塞浦路斯证券交易委员会（CySEC）授权和监管（牌照号：120/10），并均是Trading Point Group旗下公司。

风险提示: 外汇和差价合约交易对于您的投资资本含有风险。请确保您已通读并完全理解我们的风险披露。

受限地区： XM Global Limited无法为特定国家/地区的居民提供服务，例如：美国, 加拿大, 以色列和伊朗伊斯兰共和国。

XM的网站和服务，均严禁开放提供给任何受国家/地区法律法规禁止使用的任何个体。因此，若选择从该国访问本公司网站，无论该国是否禁止使用本网站，用户在使用本网站时，均有责任确保自己遵守当地法律或法规。XM不保证本公司网站上的信息，适用于所有的司法管辖区域。

XM外汇中文网

[XM外汇中文网]GPT-5.5登顶极限编程基准FrontierSWE，但作弊次数也最多

第一步:下载MT4软件

第二步：打开MT4软件

第三步：创建MT4账户

第四步：连接经纪商

第五步：充值和开始交易