
本文共 1002 字,大约阅读时间需要 3 分钟。
域适应目标重识别的带有混合记忆模型的自步对比学习
摘要
域适应目标重识别旨在将学习到的知识从已标注的源域迁移到未标注的目标域,以解决开放类重识别问题。尽管现有基于伪标签的方法取得了显著成果,但由于域差异和聚类性能不足,无法充分利用所有有价值的信息。本文提出了一种新的自步对比学习框架,结合混合记忆模型,用于学习特征表示。与传统对比学习不同,本文的框架能够联合区分源域类、目标域聚类和非聚类实例,并通过自步学习逐步创建可靠的聚类细化混合记忆模型和学习目标。在无额外标注的情况下,本文的方法在源域性能上也有所提升,并在多域适应目标重识别任务中优于现有最先进方法。
动机
基于聚类的伪标签方法通常无法充分利用目标域的无标签数据,因为基于密度的聚类(如DBSCAN)会产生聚类离群值。这些离群值通常是值得挖掘的困难训练样本,特别是在训练早期,由于大量的聚类离群值被简单丢弃,导致训练样本大幅减少。如何合理挖掘所有可用信息,是提升性能的关键。
本文提出在训练中使用全部的源域数据和目标域数据,并利用混合记忆模型提供监督:源域数据的监督来自真实标签;目标域聚类内的数据监督来自聚类标签;目标域聚类离群值的监督来自实例级标签。所有源域类、目标域聚类、目标域每个聚类离群值实例被视为平等的类别。
方法
本文提出了一种自步对比学习框架,包括图像特征编码器和混合记忆模型。混合记忆模型动态生成源域类级、目标域聚类级和非聚类实例级的监督信号,并通过统一对比损失函数统一监督网络更新。
混合记忆模型
混合记忆模型实时更新三种类别原型:源域类质心、目标域聚类质心和目标域离群值实例特征。源域类质心以类为单位动量更新;目标域聚类质心和离群值实例特征以实例为单位动量更新。
自步学习
聚类的可靠性对训练至关重要。由于训练初期网络对图像辨别性较差,聚类噪声较大,本文借鉴自步学习思想,逐步创建可靠聚类。聚类可靠性评价标准包括聚类独立性和聚类紧凑性。
训练过程
初始化:图像编码器使用预训练权重,混合记忆模型初始化为编码器对所有样本的前向计算。
聚类与离群值:每epoch前聚类,根据可靠性标准筛选可靠聚类,其他样本视为离群值。
网络与混合记忆更新:每iteration中,编码器特征→统一对比损失→网络反向传播→特征动量更新混合记忆模型。
本文的方法在目标域无额外标注的情况下,优于现有最先进目标重识别多域适应任务,并显著提升源域性能。
发表评论
最新留言
关于作者
