XM外汇中文网

全球领先的互联网券商

[XM外汇中文网]DeepSeek多模态技术报告:教模型「用手指点着想」,迷宫导航超GPT-5.4近17个百分点

币界网报道:币界网消息,DeepSeek发布了多模态推理技术报告「thinking with visual primitives」,提出了一种新推理范式:模型在思考时像人用手指点东西一样,把坐标直接穿插在思维链里,锁定每一个涉及的视觉对象。该项目在GitHub上开源,采用MIT许可。当前多模态模型的一个核心瓶颈是「指代鸿沟」,模型能看清图片,但推理时只能用自然语言描述视觉对象,场景复杂时定位困难。DeepSeek通过将边界框和点坐标变成推理的最小单元,解决了这一问题。模型基于v4-flash架构,视觉token压缩极端,测试结果显示在多个基准测试中表现优异,尤其在拓扑推理和迷宫导航任务上大幅领先其他模型。

法律: 此网站由XM Global Limited运行,注册地址是:Suite 404, The Matalon, Coney Drive, 伯利兹市, 伯利兹。

XM Global Limited受伯利兹金融服务委员会(FSC)授权和监管(牌照号: 000261/397),Trading Point of Financial Instruments Limited受塞浦路斯证券交易委员会(CySEC)授权和监管(牌照号:120/10),并均是Trading Point Group旗下公司。

风险提示: 外汇和差价合约交易对于您的投资资本含有风险。请确保您已通读并完全理解我们的风险披露。

受限地区: XM Global Limited无法为特定国家/地区的居民提供服务,例如: 美国, 加拿大, 以色列 和 伊朗伊斯兰共和国。

XM的网站和服务,均严禁开放提供给任何受国家/地区法律法规禁止使用的任何个体。因此,若选择从该国访问本公司网站,无论该国是否禁止使用本网站,用户在使用本网站时,均有责任确保自己遵守当地法律或法规。XM不保证本公司网站上的信息,适用于所有的司法管辖区域。