DeepFashion2数据集:87.3万对“买家秀-卖家秀”图像+海量标注
发布日期:2021-05-09 12:21:17 浏览次数:25 分类:精选文章

本文共 966 字,大约阅读时间需要 3 分钟。

重新优化后的文章

DeepFashion2:一个多功能时尚图像分析基准集

引言

近年来,时尚图像分析成为计算机视觉研究的重要课题之一。然而,由于实际应用场景中服装的高度变形、遮挡以及商业和消费图像之间的差异,现有最大的时尚数据集DeepFashion仍存在显著缺陷。为了应对这些挑战,本文提出DeepFashion2,一个大规模、多功能的时尚图像分析基准集。

DeepFashion2 数据集与标注

与现有时尚数据集相比,DeepFashion2具有以下四大特点:

  • 大规模:包含49.1万张图像,共4.38万个服饰标识(购物店中独特服饰的标识)。

  • 多功能:支持多种时尚理解任务,包括服饰检测和分类、密集标注和姿态检测、实例分割以及跨域实例级别的服饰检索。

  • 表达能力:单幅图像中包含多个服饰,且标识和姿态类别涵盖13种流行服饰类别。

  • 数据多样性:通过控制尺寸、遮挡、缩放和视角四大属性变量收集数据,形成了具有挑战性的基准集。

  • Match R-CNN:一种端到端的时尚图像分析模型

    在基于Mask R-CNN的基础上,提出了Match R-CNN模型,用于解决服饰检测、姿态估计、实例分割以及买家秀-卖家秀图像检索等多任务问题。Match R-CNN通过联合学习服饰特征,实现了更高效的图像分析。

    实验结果与应用

    通过大量实验验证,DeepFashion2展示了显著的性能优势。Mask R-CNN在服饰分割任务中表现优异,且Match R-CNN在跨域服饰检索任务中获得了高精度结果。具体实验结果如下:

  • 在不同尺寸、遮挡、缩放和视角下,Mask R-CNN的服饰检测和分割任务均表现良好。

  • 通过Match R-CNN实现了服饰检索的端到端学习,显著提升了检索精度和检索速度。

  • 总结与展望

    DeepFashion2不仅解决了现有时尚数据集的局限性,还通过丰富的任务定义和详尽的标注支持,为时尚图像分析研究提供了强大基础。Match R-CNN的提出也为复杂的时尚图像理解任务提供了新的解决方案。未来,DeepFashion2将在多个实际应用场景中发挥重要作用,如虚拟试衣、在线零售和智能穿搭等领域。

    这项工作的详细论文已在arXiv上发布,引文为:arxiv.org/abs/1901.07973

    如需了解更多信息,欢迎随时联系作者!

    上一篇:「房间里的大象」:让目标检测器一脸懵逼
    下一篇:28 篇论文、6 大主题带你一览 CVPR 2020 研究趋势

    发表评论

    最新留言

    关注你微信了!
    [***.104.42.241]2025年04月25日 12时07分32秒