深度学习什么叫泛化能力?自省式深度度量学习
深度学习什么叫泛化能力?自省式深度度量学习
本文提出了一种内省深度度量学习 (IDML) 框架,用于图像的不确定性感知比较。传统的深度度量学习方法会在图像之间产生可靠的语义距离,而不管不确定性水平如何。然而,我们认为一个好的相似性模型应该谨慎地考虑语义差异,以更好地处理模棱两可的图像以进行更稳健的训练。为了实现这一点,我们建议不仅使用语义嵌入,还使用伴随的不确定性嵌入来表示图像,它分别描述了图像的语义特征和歧义。我们进一步提出了一种内省的相似度度量来在图像之间进行相似性判断,同时考虑它们的语义差异和歧义。我们的框架在广泛使用的 CUB-200-2011、Cars196 和斯坦福在线产品数据集上实现了最先进的性能,用于图像检索。我们进一步评估了我们在 ImageNet-1K、CIFAR-10 和 CIFAR-100 数据集上的图像分类框架,这表明将现有的数据混合方法与所提出的内省度量相结合能够始终获得更好的结果(例如,ImageNet-1K 上的 CutMix 0.44) . 代码位于:https://github.com/wangck20/IDML。
《Introspective Deep Metric Learning》
论文地址:http://arxiv.org/abs/2205.04449v1