400-166-0296
400-166-0296
400-166-0296
新 闻
蒙帕视角|RT-DETR:一种端到端指示灯检测范式
. | 蒙帕Moonpac | 日期:2025-06-27 | 17 次浏览 | 分享到:

目前市面上针对指示灯的主流检测方法除了yolo系及其魔改方法之外,还有一类端到端方法在效果上能到达同代yolo水平但计算速度更超yolo,这种方法的典型代表就是RT-DETR。


在介绍RT-DETR之前,本文将先对它的前辈DETR的发展历程进行简单介绍。





DETR作为Transformer在目标检测领域的开山之作,一经推出便引发了极大的轰动。该方法巧妙的利用Transformer进行特征提取与解码,同时通过匈牙利匹配方法完成预测框与真实框的匹配,避免了NMS等后处理过程。

随后DAB-DETR引入了动态锚框作为查询向量,从而对DETR中的100个查询向量进行了解释。之后Deformable-DETR针对Transformer中自注意力计算复杂度高的问题,提出可变形注意力计算,即通过可学习的选取少量向量进行注意力计算,大幅的降低了计算量。







DN-DETR认为匈牙利匹配的二义性是导致DETR训练收敛慢的原因,因此提出查询降噪机制,即利用先前DAB-DETR中将查询向量解释为锚框的原理,给查询向量添加一些噪声来辅助模型收敛,最终大幅提升了模型的训练速度。

DINO则是在DAB-DETR与DN-DETR的基础上进行进一步的融合与改进,是一种半里程碑式的方法。H-DETR为使模型获取更多的正样本特征,从而提升检测精度,因此提出混合匹配方法,在训练阶段,包含原始的匈牙利匹配分支与一个一对多的辅助匹配分支,而在推理阶段,则只有一个匈牙利匹配分支。





上述方法尽管已经大幅提升了检测精度,降低了计算复杂度,但其受Transformer本身高计算复杂度的制约,DETR类目标检测方法的实时性始终令人难以满意,尤其是相较于YOLO等单阶段目标检测方法,其检测速度的确差别巨大。直到RT-DETR的提出,DETR类方法才在检测速度和检测精度超越了同时代yolov8。



RT-DETR 主要创新点有以下3方面:


1


高效混合编码器:RT-DETR使用了一种高效的混合编码器,通过解耦尺度内交互和跨尺度融合来处理多尺度特征。这种独特的基于视觉Transformer的设计降低了计算成本,并允许实时物体检测。

2


IoU感知查询选择:RT-DETR通过利用IoU感知的查询选择改进了目标查询初始化。这使得模型能够聚焦于场景中最相关的目标,从而提高了检测精度。

3


自适应推理速度:RT-DETR支持通过使用不同的解码器层来灵活调整推理速度,而无需重新训练。这种适应性便于在各种实时目标检测场景中的实际应用。


图片

RT-DETR整体结构图


RT-DETR 的推理过程主要包括以下步骤:


1、将骨干网络的最后三个阶段的特征 {S3,S4,S5} 输入到编码器


2、混合编码器通过尺度内特征交互(AIFI)和跨尺度特征融合模块(CCFM)将多尺度特征转换为图像特征序列


3、IoU 感知的查询选择从编码器输出的特征序列中选择固定数量的特征作为解码器的初始目标查询


4、解码器通过辅助预测头迭代优化目标查询,生成边界框和置信度得分


蒙帕团队对指示灯数据进行了RT-DETR的模型训练与推理,并与yolov5进行了实图对比测试。训练条件如下:


训练图像控制在1000-1500张,绿灯、红灯、黄灯、蓝灯的训练比例控制在2:1:1:1左右,batch-size统一设置为2, epoch统一设置为80。


测试时,置信度阈值统一设为0.15,nms阈值设为0.45。总共选取了5个数据集进行测试,选取有典型意义的图像进行结果展示。


对比1-典型绿灯检测场景(左yolov5s,右RT-DETR)


图片


v5s中间蓝灯漏检,RT-DET右上角错检,除此之外,二者相同。


对比2-典型红、黄、蓝灯检测场景(左yolov5s,右RT-DETR):


图片


v5s与RT-DET检测完全相同,v5s由于阈值存在重框问题。


对比3-人造红、黄、蓝灯检测场景(左yolov5s,右RT-DETR):


图片


v5s有1个黄灯错判为红灯,RT-DETR红灯漏检1个、错检测1个、1个黄灯错判为红灯。


从整体测试看,v5s与rt-detr在性能上相当(蒙帕团队使用的yolov5是主分支上的,相比最初v5已经做了很多改进),各别图像上v5s优于RT-DETR但不明显。在速度上RT-DETR优势明显,fps超过同类型v5的30%~50%,但计算负载略高于v5。


目前RT-DETR已经发展到了第三代,相对第一代又有诸多改进。可以预见,基于DETR的端到端方法是除yolo外的又一检测利器。


未来,蒙帕将继续针对这种指示灯检测范式进行深入研究,不断提高日常巡检中机器人对指示灯识别的准确率。



————————————————————————————————————————————————————————————————————————————————————