PAMI中心3项研究成果被计算机视觉顶级会议CVPR2021录用

时间:2021-03-03 点击:

在近期公布的2021计算机视觉与模式识别国际顶级会议(CVPR 2021)论文录用名单中,模式识别与机器智能研究中心的3项研究成果被大会接收。CVPR是计算机学科普遍认可的计算机视觉领域顶级国际会议,被中国计算机学会(CCF)列为A类会议,今年论文录用率为23%左右,该会议将于619-25日举办。根据当前流行的Google Scholar Citation统计,CVPR排在所有学科目录第5位(Nature1位,Science3位,Cell8位),排在电信学科所有期刊和会议的第1位。以下是三篇被接受论文的信息:

 

1) 由硕士生阮德莲完成的论文《Feature Decomposition and Reconstruction Learning for Effective Facial Expression Recognition》主要解决人脸表情识别中严重的类间相似性问题,论文框架如图1所示。人脸表情信息由不同表情之间的共享信息和每个表情各自的特有信息组成。基于上述观察,该论文设计了一个基于特征解构与重构学习的人脸表情识别方法,分别用于学习表情信息中的共享信息和特有信息。具体地,该方法主要包括两个核心模块——特征解构学习模块和特征重构学习模块。其中,特征解构学习模块把由基础网络提取的基础特征分解为一系列潜在特征向量,这些潜在特征向量有效地建模了表情中的共享信息。然后,特征重构学习模块分别对这一系列潜在特征向量进行特征内部和特征之间的相关性建模,从而学习表情的特有信息。实验结果表明该方法在三个室内数据集(包括 CK+ MMI Oulu­CASIA)和两个室外数据集(包括 RAF­DB SFEW)上都有优越的性能表现。该论文由严严副教授和王菡子教授、美团的赖申奇和柴振华博士、阿德莱德大学的沈春华教授共同指导。



1 算法框架图


2) 由硕士生疏颖完成的论文《Learning Spatial-Semantic Relationship for Facial Attribute Recognition with Limited Labeled Data》主要解决在标签不足情况下的人脸属性识别问题,论文框架如图2所示。随着深度学习的进展,人脸属性识别技术也获得了长足的进步。然而在现实生活中,人脸属性识别应用只能获得少量的有标签数据,这大大降低了识别的性能。为了解决这一问题,该论文利用多任务训练方式,根据人脸属性的特点设计了三个不同的学习分支,充分挖掘人脸图像中的空间信息和语义信息,在标签不足的情况下也同样获得了很好的识别精度。这项研究有较好的应用前景和现实意义,在保有精度的同时可以减少对于数据标签的依赖,因此更加符合现实应用场景的需求。该论文由严严副教授和王菡子教授、厦门理工学院的陈思副教授、伦敦大学学院的薛景浩副教授和阿德莱德大学的沈春华教授共同指导。


2 算法框架图

3) 由硕士生陈超奇、郑泽镖合作完成的论文《I3Net: Implicit Instance-Invariant Network for Adapting One-Stage Object Detectors》主要解决由于域之间的分布差异导致跨域目标检测性能下降的问题,论文框架如图3所示。近来在双阶段跨域检测方面的工作已经广泛地探索了局部特征模式以实现更准确的域适应结果。这些方法严重依赖于区域提议机制和基于ROI的实例级特征来针对前景目标设计细粒度的特征对齐模块。但是,对于单阶段检测器来说,很难甚至不可能在检测流程中获得显式的实例级特征。为此,我们提出了一个隐式实例不变网络,该网络专门为适配单阶段检测器而设计,并通过利用不同层中深度特征的自然特性来隐式地学习实例不变特征。具体来说,论文从三个方面促进域适应:a)动态和类平衡重加权策略(DCBR),该策略考虑了域内和类内变化的共存,以便将较大的权重分配给那些样本稀少的类别和容易适配的样本;(b)类别感知目标模式匹配模块(COPM),在类别信息的引导下,增强跨域前景目标的匹配,并抑制含有信息量较少的背景;(c)正则联合类别对齐模块(RJCA),该模块通过一致性正则化在多个特定于域的层上同时实现类别对齐。提出的方案在多个数据集上都达到了SOTA的效果。该论文由黄悦副教授(通信作者)、丁兴号教授和香港大学俞益洲教授共同指导完成。


3 算法框架图