DeepFashion2数据集：87.3万对“买家秀-卖家秀”图像+海量标注-白红宇的个人博客

发布日期：2021-05-09 12:21:17 浏览次数：25 分类：精选文章

本文共 966 字，大约阅读时间需要 3 分钟。

重新优化后的文章

DeepFashion2：一个多功能时尚图像分析基准集

引言

近年来，时尚图像分析成为计算机视觉研究的重要课题之一。然而，由于实际应用场景中服装的高度变形、遮挡以及商业和消费图像之间的差异，现有最大的时尚数据集DeepFashion仍存在显著缺陷。为了应对这些挑战，本文提出DeepFashion2，一个大规模、多功能的时尚图像分析基准集。

DeepFashion2 数据集与标注

与现有时尚数据集相比，DeepFashion2具有以下四大特点：

大规模：包含49.1万张图像，共4.38万个服饰标识（购物店中独特服饰的标识）。

多功能：支持多种时尚理解任务，包括服饰检测和分类、密集标注和姿态检测、实例分割以及跨域实例级别的服饰检索。

表达能力：单幅图像中包含多个服饰，且标识和姿态类别涵盖13种流行服饰类别。

数据多样性：通过控制尺寸、遮挡、缩放和视角四大属性变量收集数据，形成了具有挑战性的基准集。

Match R-CNN：一种端到端的时尚图像分析模型

在基于Mask R-CNN的基础上，提出了Match R-CNN模型，用于解决服饰检测、姿态估计、实例分割以及买家秀-卖家秀图像检索等多任务问题。Match R-CNN通过联合学习服饰特征，实现了更高效的图像分析。

实验结果与应用

通过大量实验验证，DeepFashion2展示了显著的性能优势。Mask R-CNN在服饰分割任务中表现优异，且Match R-CNN在跨域服饰检索任务中获得了高精度结果。具体实验结果如下：

在不同尺寸、遮挡、缩放和视角下，Mask R-CNN的服饰检测和分割任务均表现良好。

通过Match R-CNN实现了服饰检索的端到端学习，显著提升了检索精度和检索速度。

总结与展望

DeepFashion2不仅解决了现有时尚数据集的局限性，还通过丰富的任务定义和详尽的标注支持，为时尚图像分析研究提供了强大基础。Match R-CNN的提出也为复杂的时尚图像理解任务提供了新的解决方案。未来，DeepFashion2将在多个实际应用场景中发挥重要作用，如虚拟试衣、在线零售和智能穿搭等领域。

这项工作的详细论文已在arXiv上发布，引文为：arxiv.org/abs/1901.07973。

如需了解更多信息，欢迎随时联系作者！

上一篇：「房间里的大象」：让目标检测器一脸懵逼

下一篇：28 篇论文、6 大主题带你一览 CVPR 2020 研究趋势

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！