浙江大学网络与媒体实验室

【喜讯】网络与媒体实验室高水平论文被IEEE Transactions on Intelligent Vehicles录用

编辑：netmedia 发布时间：2024-07-15 访问次数：1318

近日，由董亚波老师和鲁东明老师指导的2022级博士研究生刘其锋同学一篇题为MT-SSD: Single-Stage 3D Object Detector Based on Magnification Transformation的论文被IEEE Transactions on Intelligent Vehicles录用。该期刊属于智能车领域的顶级期刊，级别为中科院一区，影响因子8.2。

代码地址：

https://github.com/qifeng22/MT-SSD

研究背景：

三维目标检测在自动驾驶和虚拟现实中扮演着至关重要的角色。点云作为三维物体的一种表示形式，因其能够直接显示物体的空间位置信息而被广泛研究。在这些检测算法中，单阶段检测方法在推理速度上具有显著优势。然而，与两阶段目标检测算法相比，它们在检测精度上有一定差距。在当前的单阶段目标检测算法中，基于点的目标检测模型在特征提取过程中大量使用集合抽象层（Set Abstraction，SA）。对SA层内部计算过程的详细检查发现，在单个点上执行了多个1×1卷积操作。这种方法忽略了相邻点之间的上下文信息，因此未能有效利用点云之间的初始特征。此外，我们还观察到当将IoU（交并比）设置为不同值时，检测精度存在相当大的差异。这一结果表明，三维目标检测模型在目标定位方面仍有进一步提升的潜力。

研究内容：

MT-SSD整体框架图

我们提出了一个基于放大变换（MT-SSD）的单阶段目标检测器。MT-SSD引入了两个主要创新点：（1）在点云的推理和训练过程中，MT-SSD对原始点云P应用线性变换。然后，3D目标检测模型基于变换后的点云P'进行分类和定位目标。最后，预测结果会经过一个逆线性变换。通过简单的线性变换，可以在确保计算效率的同时提高模型的检测精度。（2）在集合抽象层（Set Abstraction layer）中，我们添加了多个1xN卷积模块来捕获邻近点云的信息，形成了上下文集合抽象（CSA）层，其中N表示附近点的数量。较大的卷积核确保了邻近点云的完整覆盖。通过在SA层内集成多个卷积模块，我们的方法有效地聚合了邻近所有点云的信息。这种方法确保了点云结构的更全面表示，从而为后续的检测任务提供了丰富的信息。

研究结果：

不同模型在RTX 3090Ti的识别准确率和推断速度的对比，KITTI数据集

KITTI测试集准确率对比

通过在KITTI验证集上的实验结果可以看出，我们模型在识别速度和推断精度上得到了权衡，在车辆检测Moderate中，实现了81.67%的检测精度。

Waymo验证集准确率对比

我们的模型在Waymo数据集中车辆检测方面达到了75.11%的平均精度，这标志着它在单阶段目标检测算法中取得了领先的结果，并且显著缩小了与两阶段目标检测算法之间的差距。

模型显存占用情况对比

作者简介：

刘其锋，2022级博士生，指导老师：鲁东明、董亚波。主要研究方向：三维目标检测，模型压缩和轻量化。

董亚波，浙江大学计算机科学与技术学院副教授，主要研究方向：物联网技术、文物保护技术、传感器数据挖掘及处理等。

鲁东明，博士，浙江大学计算机科学与技术学院教授，主要研究方向：虚拟现实、计算机视觉、无线传感器网络技术、大数据人工智能等。