近期,我中心一篇关于视频目标检测的论文(题目为DGRNet: A Dual-level Graph Relation Network for Video Object Detection)被CCF A类、JCR一区国际期刊《IEEE Transactions on Image Processing》接收,DOI: 10.1109/TIP.2023.3285136,2023年影响因子为10.6。该论文由我中心博士生齐强、硕士生侯天翔等完成,由王菡子教授、严严教授、卢杨老师共同指导。该研究工作得到了国家自然科学基金项目(U21A20514, 62071404, 62002302)等项目的支持。

视频目标检测是计算机视觉领域中的一项基础而又重要的任务。目前的视频目标检测方法大多通过估计特征到特征(Fea2Fea)的关系来执行特征聚合。然而,由于目标遮挡、运动模糊或罕见姿态等原因,大多数现有的视频目标检测方法无法稳定地估计Fea2Fea的关系,从而导致了受限的检测性能。本文从图的角度研究了Fea2Fea的关系,并提出了一种双级别的图关系网络(简称DGRNet),以用于视频目标检测。所提出的DGRNet利用残差图卷积网络在帧级别和候选框级别上同时建模Fea2Fea的关系,这有助于在时空域中执行更有效的特征聚合。在具有挑战性的大规模的ImageNet VID数据集上进行了大量实验,实验结果表明,与现有的视频目标检测方法相比,所提出的DGRNet方法能够获得较好的检测性能(使用ResNet-101和ResNeXt-101可分别获得85.0% mAP 和86.2% mAP)。
论文链接:https://ieeexplore.ieee.org/document/10179249