MMdetection 目标检测工具箱
发布日期:2021-05-10 23:43:45 浏览次数:40 分类:精选文章

本文共 1641 字,大约阅读时间需要 5 分钟。

MMdetection 是由商汤科技和香港中文大学开源的基于 PyTorch 的深度学习目标检测工具箱,支持包括 Faster-RCNN、Mask-RCNN、Fast-RCNN 在内的主流目标检测框架,同时还扩展了 Cascade-RCNN、SSD 等多种框架。作为目标检测领域的实用工具,它为研究人员和开发者提供了灵活的接口和强大的功能支持。

系统环境要求

MMdetection 的安装和运行主要依赖以下环境:

  • 操作系统:建议使用 Ubuntu 18.04 或更高版本。
  • GPU़ता:支持 NVIDIA 牛驰显卡,可使用 CUDA 9.0 或更高版本。
  • **库 /^**:PyTorch 1.1 及以上版本,建议安装 PyTorch 和 TVdispose。
  • Python:Python 3.6 及以上版本。

安装说明

安装时可以选择使用 conda 或 pip3,但个人推荐使用 pip3:

sudo apt-get install pip3

接下来安装必要的库:

pip3 install torch==1.1
pip3 install torchvision

如果需要其他依赖项,例如 h5py,可以自行安装:

pip3 install h5py

安装 Cython 可能会需要编译器支持:

pip3 install Cython

最后安装 MM-CV 库,这是 MMdetection 的核心组件:

git clone https://github.com/open-mmlab/mmcv.git
cd mmcv
pip install .

使用 MMdetection 训练 VOC 数据集

数据集准备

在项目根目录下,创建以下文件夹结构:

mmdetection/
├── mmdet/
├── tools/
├── configs/
└── data/
├── VOCdevkit/
│ ├── VOC2007/
│ │ ├── Annotations/ #存放相应的xml文件
│ │ └── Instance annotations)/
│ │ #存放对应的图片
│ │ ├── JPEGImages/
│ │ ├── ImageSets/
│ │ └── Main/

配置修改

对应 VOC 数据集的处理需要修改以下文件:

  • class_names.py: 将 /mmdetection/mmdet/core/evaluation/class_names.py 中的 voc_classes 替换为您需要训练的数据集的类别名称。

  • voc.py: 修改 /mmdetection/mmdet/datasets/voc.py 中的类别信息。如果只有一个类别,需要在类别名称后加逗号,避免报错。

  • 配置文件: 修改 /mmdetection/configs/ 中的配置文件(例如 cascade_rcnn_r50_fpn_1x.py),需要修改以下参数:

    • num_classes:根据数据集的类别数量调整。
    • data_type:根据数据预处理需求调整。
    • data_root:指定数据集的存储路径。
    • imgs_per_gpu:设定训练时的图像处理数量。
  • 修改建造工具

    修改 /mmdetection/mmdet/datasets/loader/build_loader.py 中的 batch_size 为您需要的批量大小。

    训练开始

    在终端运行以下命令,使用预训练模型进行训练(具体配置文件根据实际需求调整):

    python3 tools/train.py configs/cascade_rcnn_r50_fpn_1x.py

    MMdetection 提供了灵活的接口和丰富的培训资源,能够帮助用户轻松上手并进行高效的目标检测任务。

    上一篇:顺序查找
    下一篇:图像操作

    发表评论

    最新留言

    表示我来过!
    [***.240.166.169]2025年05月04日 23时18分13秒