XM外汇中文网

全球领先的互联网券商

[XM外汇中文网]Blueprint-Bench 2发布:AI首现基于2D照片的真实空间推理能力

币界网报道:币界网消息,andon labs发布的Blueprint-Bench 2是一个测试AI空间推理能力的评估基准,要求agent根据约20张室内照片生成准确的2D户型图。此次测试引入了跨任务的「记事本」系统,允许agent在处理50套公寓时记录布局规律并优化生成策略。测评结果显示,gpt-5.5、gemini 3.1 pro和claude opus 4.7稳居前三,首次展现了从2D照片理解真实空间的能力。例如,gemini 3.1 pro能通过不同照片中的洗衣机推断相机拍摄朝向,gpt-5.5则通过门框位置推断卧室与走廊的连通性。同时,gemini robotics-er 1.6的表现低于预期,得分甚至低于轻量级的gemini 3 flash,表明其空间特长未成功转化为户型生成能力。

法律: 此网站由XM Global Limited运行,注册地址是:Suite 404, The Matalon, Coney Drive, 伯利兹市, 伯利兹。

XM Global Limited受伯利兹金融服务委员会(FSC)授权和监管(牌照号: 000261/397),Trading Point of Financial Instruments Limited受塞浦路斯证券交易委员会(CySEC)授权和监管(牌照号:120/10),并均是Trading Point Group旗下公司。

风险提示: 外汇和差价合约交易对于您的投资资本含有风险。请确保您已通读并完全理解我们的风险披露。

受限地区: XM Global Limited无法为特定国家/地区的居民提供服务,例如: 美国, 加拿大, 以色列 和 伊朗伊斯兰共和国。

XM的网站和服务,均严禁开放提供给任何受国家/地区法律法规禁止使用的任何个体。因此,若选择从该国访问本公司网站,无论该国是否禁止使用本网站,用户在使用本网站时,均有责任确保自己遵守当地法律或法规。XM不保证本公司网站上的信息,适用于所有的司法管辖区域。