形状锚点引导学习策略(AncLearn)的核心理念在于生成贴合物体表面的锚点,以约束特征分组和实例点采样的空间范围。这一策略巧妙地解决了噪声干扰问题,为高质量的室内场景理解铺平了道路。 锚点生成机制是AncLearn的基础。系统首先从单位球面上均匀选择N个初始锚点,然后通过变形层将这些锚点移动到目标物体表面。变形过程由多层感知器(MLP)和Tanh激活函数推断的偏移量控制,确保锚点能够准确描绘物体的几何形状。这些变形后的锚点不仅位于物体表面,还能捕捉到物体的整体结构特征。 在训练阶段,系统使用Chamfer距离损失函数监督锚点的变形学习。这一损失函数计算变形锚点集合与从场景对齐的3D网格采样的表面点之间的距离,确保锚点能够贴合物体表面。通过这种监督机制,锚点不仅能适应物体的各种形状分布,还能辅助挖掘上下文信息,恢复未观察到的结构,例如被观察到的地板区域支撑的缺失物体底部。 表面锚点适应物体形状分布的能力是AncLearn的关键优势。与传统的固定范围分组或盒状约束不同,形状锚点能够动态调整以贴合不规则形状的物体。在ScanNetv2数据集的测试中,AncLearn对于各种形状的物体都表现出色,尤其是对于几何复杂的物体如折叠椅、异形沙发和显示器等。 锚点引导特征分组器的工作原理简单而高效。在生成形状锚点后,系统通过插值操作将种子点特征(由双分支PointNet++主干提取)传播到每个锚点,然后通过多层感知器进行处理。由于变形锚点主要位于物体表面,因此用于传播的种子点特征可以可靠地从与目标相关的区域中选择。最终,系统通过平均锚点特征获得噪声减少的提议表示。 在预测阶段,AncLearn采用两个解码器分别从投票特征和锚点特征预测物体类别和定向框参数。这是基于投票特征包含更多上下文信息,而锚点特征更专注于目标的考虑。最终的物体参数通过可学习权重平均两种预测结果获得。这种融合策略充分利用了两种特征的互补优势,进一步提高了检测精度。 锚点引导的实例点采样是AncLearn在重建阶段的另一大创新。系统首先将正提议的形状锚点添加到原始场景扫描中,以增强室内物体的结构信息。然后,从增强的扫描中选择位于每个锚点给定半径内的点,并用这些选定的点更新锚点集以扩展搜索空间。由于搜索空间紧密贴合物体形状,系统可以进一步采样更多具有高覆盖率的实例点。这种锚点引导的采样方法高效生成物体几何先验,无需依赖额外的分割模块。
形状锚点引导学习策略(AncLearn)的核心理念在于生成贴合物体表面的锚点,以
酸酸甜甜小苏
2025-06-14 21:34:28
0
阅读:0