四大权威评测中表现亮眼！商汤开源模型凭什么领先GPT-5？

11月10日，商汤科技正式发布并开源SenseNova-SI系列空间智能大模型。该模型在空间理解与推理核心任务上实现突破性进展，不仅大幅领先同量级开源模型，更成功超越GPT-5、Gemini2.5Pro等国际顶尖闭源模型，为AI理解三维物理世界奠定关键基础。

当前行业领先大模型虽在知识问答、写作、编程等领域表现突出，却普遍存在空间智能短板——难以准确理解物理世界的空间结构、视角关系及推理逻辑，这一缺陷成为具身智能体与现实世界交互的核心障碍。例如在儿童可轻松完成的俯视图选择任务中，GPT-5仍会做出错误判断，而空间智能正是AI从数字空间走向物理世界的关键试金石。

在儿童可轻松完成的俯视图选择任务中，GPT-5仍会做出错误判断

针对这一行业痛点，商汤科技通过系统性创新打造SenseNova-SI系列模型，包含2B和8B两个规格，在VSI-Bench、MMSI-Bench、MindCube、ViewSpatial四大权威评测中表现亮眼。其中，SenseNova-SI-8B以60.99的平均成绩脱颖而出，不仅远超Qwen3-VL-8B（40.16）、BAGEL-7B（35.01）等开源多模态模型，以及SpatialMLLM等专门空间智能模型，更超越了GPT-5（49.68）和Gemini2.5Pro（48.81）的评测表现。在具体任务中，该模型正确解答了立方体俯视图选择、场景中物体方位判断、车辆行驶轨迹预测等空间问题，而GPT-5在同类任务中多次出现判断失误。

以上为GPT-5和SenseNova-SI-8B模型面对空间智能问题，给出的答案对比

SenseNova-SI的性能飞跃源于商汤独创的训练范式。团队依托空间能力分类体系与海量数据积累，首次在空间智能领域验证了“尺度效应”——通过高质量、大规模数据训练，可显著提升模型空间认知能力。该训练方法具备通用性，能对不同架构基模型进行有效增强，在空间测量、重构、关系判断、视角转换、形变认知及推理六大核心维度实现全面提升。商汤科技后续将发布详细技术报告，披露完整技术方案。

作为商汤“开悟”世界模型的重要补充，SenseNova-SI与“悟能”具身智能平台相辅相成，将为自动驾驶、机器人等领域提供关键技术支撑，推动AI在物理世界的自主探索与进化。同时，商汤同步开源空间智能测评平台EASI及“英雄榜”，致力于统一技术评估标准，为学术界和工业界提供权威基准，促进行业协同创新。

此次SenseNova-SI的发布与开源，标志着AI在三维世界理解能力上迈出关键一步。据悉，商汤科技将持续深耕空间智能技术，推动下一代通用人工智能更好地融入物理世界，为千行百业的智能化升级注入新动能。