游戏百科

四大权威评测中表现亮眼!商汤开源模型凭什么领先GPT-5?

11月10日,商汤科技正式发布并开源SenseNova-SI系列空间智能大模型。该模型在空间理解与推理核心任务上实现突破性进展,不仅大幅领先同量级开源模型,更成功超越GPT-5、Gemini2.5Pro等国际顶尖闭源模型,为AI理解三维物理世界奠定关键基础。

当前行业领先大模型虽在知识问答、写作、编程等领域表现突出,却普遍存在空间智能短板——难以准确理解物理世界的空间结构、视角关系及推理逻辑,这一缺陷成为具身智能体与现实世界交互的核心障碍。例如在儿童可轻松完成的俯视图选择任务中,GPT-5仍会做出错误判断,而空间智能正是AI从数字空间走向物理世界的关键试金石。

在儿童可轻松完成的俯视图选择任务中,GPT-5仍会做出错误判断

针对这一行业痛点,商汤科技通过系统性创新打造SenseNova-SI系列模型,包含2B和8B两个规格,在VSI-Bench、MMSI-Bench、MindCube、ViewSpatial四大权威评测中表现亮眼。其中,SenseNova-SI-8B以60.99的平均成绩脱颖而出,不仅远超Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等开源多模态模型,以及SpatialMLLM等专门空间智能模型,更超越了GPT-5(49.68)和Gemini2.5Pro(48.81)的评测表现。在具体任务中,该模型正确解答了立方体俯视图选择、场景中物体方位判断、车辆行驶轨迹预测等空间问题,而GPT-5在同类任务中多次出现判断失误。

以上为GPT-5和SenseNova-SI-8B模型面对空间智能问题,给出的答案对比

SenseNova-SI的性能飞跃源于商汤独创的训练范式。团队依托空间能力分类体系与海量数据积累,首次在空间智能领域验证了“尺度效应”——通过高质量、大规模数据训练,可显著提升模型空间认知能力。该训练方法具备通用性,能对不同架构基模型进行有效增强,在空间测量、重构、关系判断、视角转换、形变认知及推理六大核心维度实现全面提升。商汤科技后续将发布详细技术报告,披露完整技术方案。

作为商汤“开悟”世界模型的重要补充,SenseNova-SI与“悟能”具身智能平台相辅相成,将为自动驾驶、机器人等领域提供关键技术支撑,推动AI在物理世界的自主探索与进化。同时,商汤同步开源空间智能测评平台EASI及“英雄榜”,致力于统一技术评估标准,为学术界和工业界提供权威基准,促进行业协同创新。

此次SenseNova-SI的发布与开源,标志着AI在三维世界理解能力上迈出关键一步。据悉,商汤科技将持续深耕空间智能技术,推动下一代通用人工智能更好地融入物理世界,为千行百业的智能化升级注入新动能。