
本文共 1641 字,大约阅读时间需要 5 分钟。
MMdetection 是由商汤科技和香港中文大学开源的基于 PyTorch 的深度学习目标检测工具箱,支持包括 Faster-RCNN、Mask-RCNN、Fast-RCNN 在内的主流目标检测框架,同时还扩展了 Cascade-RCNN、SSD 等多种框架。作为目标检测领域的实用工具,它为研究人员和开发者提供了灵活的接口和强大的功能支持。
系统环境要求
MMdetection 的安装和运行主要依赖以下环境:
- 操作系统:建议使用 Ubuntu 18.04 或更高版本。
- GPU़ता:支持 NVIDIA 牛驰显卡,可使用 CUDA 9.0 或更高版本。
- **库 /^**:PyTorch 1.1 及以上版本,建议安装 PyTorch 和 TVdispose。
- Python:Python 3.6 及以上版本。
安装说明
安装时可以选择使用 conda 或 pip3,但个人推荐使用 pip3:
sudo apt-get install pip3
接下来安装必要的库:
pip3 install torch==1.1pip3 install torchvision
如果需要其他依赖项,例如 h5py,可以自行安装:
pip3 install h5py
安装 Cython 可能会需要编译器支持:
pip3 install Cython
最后安装 MM-CV 库,这是 MMdetection 的核心组件:
git clone https://github.com/open-mmlab/mmcv.gitcd mmcvpip install .
使用 MMdetection 训练 VOC 数据集
数据集准备
在项目根目录下,创建以下文件夹结构:
mmdetection/├── mmdet/├── tools/├── configs/└── data/ ├── VOCdevkit/ │ ├── VOC2007/ │ │ ├── Annotations/ #存放相应的xml文件 │ │ └── Instance annotations)/ │ │ #存放对应的图片 │ │ ├── JPEGImages/ │ │ ├── ImageSets/ │ │ └── Main/
配置修改
对应 VOC 数据集的处理需要修改以下文件:
class_names.py: 将 /mmdetection/mmdet/core/evaluation/class_names.py 中的 voc_classes 替换为您需要训练的数据集的类别名称。
voc.py: 修改 /mmdetection/mmdet/datasets/voc.py 中的类别信息。如果只有一个类别,需要在类别名称后加逗号,避免报错。
配置文件: 修改 /mmdetection/configs/ 中的配置文件(例如 cascade_rcnn_r50_fpn_1x.py),需要修改以下参数:
- num_classes:根据数据集的类别数量调整。
- data_type:根据数据预处理需求调整。
- data_root:指定数据集的存储路径。
- imgs_per_gpu:设定训练时的图像处理数量。
修改建造工具
修改 /mmdetection/mmdet/datasets/loader/build_loader.py 中的 batch_size 为您需要的批量大小。
训练开始
在终端运行以下命令,使用预训练模型进行训练(具体配置文件根据实际需求调整):
python3 tools/train.py configs/cascade_rcnn_r50_fpn_1x.py
MMdetection 提供了灵活的接口和丰富的培训资源,能够帮助用户轻松上手并进行高效的目标检测任务。
发表评论
最新留言
关于作者
