近期,我中心一篇关于视频目标检测的论文(题目为IMC-Det: Intra-Inter Modality Contrastive Learning for Video Object Detection)被CCF A类期刊International Journal of Computer Vision接收,DOI: https://doi.org/10.1007/s11263-024-02201-9,近五年影响因子为14.5。该论文由我实验室博士生齐强、硕士生邱震宇等完成,由王菡子教授、严严教授、卢杨老师共同指导。该研究工作得到了国家自然科学基金项目(U21A20514, 62372388, 62071404 and 62376233)等项目的支持。

视频目标检测是计算机视觉领域中的一项基础而又重要的研究方向。目前的视频目标检测方法大多使用视觉模态内的时空信息进行特征聚合。然而,由于目标遮挡、运动模糊、罕见姿态等导致的表观退化问题,大多数现有的视频目标检测方法无法稳定地预测表观退化的目标,从而导致了受限的检测性能。本文提出了一种基于内外模态的视频目标检测方法(简称IMC-Det)。该方法能够同时利用视觉模态和文本模态中的有益信息来增强目标表观表示,以提高视频目标检测的性能。在具有挑战性的大规模的ImageNet VID数据集上进行了大量实验,实验结果表明,与现有的视频目标检测方法相比,所提出的IMC-Det方法能够获得较好的检测性能(即使用ResNet-101和ResNeXt-101可分别获得85.5% mA P和86.7% mAP)。
论文连接:https://doi.org/10.1007/s11263-024-02201-9