Skip to content

Latest commit

 

History

History
176 lines (133 loc) · 6.49 KB

README.md

File metadata and controls

176 lines (133 loc) · 6.49 KB

PaddleDetection C++预测部署方案

本文档结构

1.说明

2.主要目录和文件

3.编译

4.预测并可视化结果

1.说明

本目录提供一个跨平台的图像检测模型的C++预测部署方案,用户通过一定的配置,加上少量的代码,即可把模型集成到自己的服务中,完成相应的图像检测任务。

主要设计的目标包括以下四点:

  • 跨平台,支持在 Windows 和 Linux 完成编译、开发和部署
  • 可扩展性,支持用户针对新模型开发自己特殊的数据预处理等逻辑
  • 高性能,除了PaddlePaddle自身带来的性能优势,我们还针对图像检测的特点对关键步骤进行了性能优化
  • 支持多种常见的图像检测模型,如YOLOv3, Faster-RCNN, Faster-RCNN+FPN,用户通过少量配置即可加载模型完成常见检测任务

2.主要目录和文件

deploy
├── detection_demo.cpp # 完成图像检测预测任务C++代码
│
├── conf
│   ├── detection_rcnn.yaml #示例faster rcnn 目标检测配置
│   └── detection_rcnn_fpn.yaml #示例faster rcnn + fpn目标检测配置
├── images
│   └── detection_rcnn # 示例faster rcnn + fpn目标检测测试图片目录
├── tools
│   └── vis.py # 示例图像检测结果可视化脚本
├── docs
│   ├── linux_build.md # Linux 编译指南
│   ├── windows_vs2015_build.md # windows VS2015编译指南
│   └── windows_vs2019_build.md # Windows VS2019编译指南
│
├── utils # 一些基础公共函数
│
├── preprocess # 数据预处理相关代码
│
├── predictor # 模型加载和预测相关代码
│
├── CMakeList.txt # cmake编译入口文件
│
└── external-cmake # 依赖的外部项目cmake(目前仅有yaml-cpp)

3.编译

支持在WindowsLinux平台编译和使用:

Windows上推荐使用最新的Visual Studio 2019 Community直接编译CMake项目。

4.预测并可视化结果

完成编译后,便生成了需要的可执行文件和链接库。这里以我们基于faster rcnn检测模型为例,介绍部署图像检测模型的通用流程。

4.1. 下载模型文件

我们提供faster rcnn,faster rcnn+fpn模型用于预测coco17数据集,可在以下链接下载:faster rcnn示例模型下载地址faster rcnn + fpn示例模型下载地址

下载并解压,解压后目录结构如下:

faster_rcnn_pp50/
├── __model__ # 模型文件
│
└── __params__ # 参数文件

解压后把上述目录拷贝到合适的路径:

假设Windows系统上,我们模型和参数文件所在路径为D:\projects\models\faster_rcnn_pp50

假设Linux上对应的路径则为/root/projects/models/faster_rcnn_pp50/

4.2. 修改配置

inference源代码(即本目录)的conf目录下提供了示例基于faster rcnn的配置文件detection_rcnn.yaml, 相关的字段含义和说明如下:

DEPLOY:
    # 是否使用GPU预测
    USE_GPU: 1
    # 模型和参数文件所在目录路径
    MODEL_PATH: "/root/projects/models/faster_rcnn_pp50"
    # 模型文件名
    MODEL_FILENAME: "__model__"
    # 参数文件名
    PARAMS_FILENAME: "__params__"
    # 预测图片的标准输入,尺寸不一致会resize
    EVAL_CROP_SIZE: (608, 608)
    # resize方式,支持 UNPADDING和RANGE_SCALING
    RESIZE_TYPE: "RANGE_SCALING"
    # 短边对齐的长度,仅在RANGE_SCALING下有效
    TARGET_SHORT_SIZE : 800
    # 均值
    MEAN:  [0.4647, 0.4647, 0.4647]
    # 方差
    STD: [0.0834, 0.0834, 0.0834]
    # 图片类型, rgb或者rgba
    IMAGE_TYPE: "rgb"
    # 像素分类数
    NUM_CLASSES: 1
    # 通道数
    CHANNELS : 3
    # 预处理器, 目前提供图像检测的通用处理类DetectionPreProcessor
    PRE_PROCESSOR: "DetectionPreProcessor"
    # 预测模式,支持 NATIVE 和 ANALYSIS
    PREDICTOR_MODE: "ANALYSIS"
    # 每次预测的 batch_size
    BATCH_SIZE : 3 
    # 长边伸缩的最大长度,-1代表无限制。
    RESIZE_MAX_SIZE: 1333
    # 输入的tensor数量。
    FEEDS_SIZE: 3
    # 是否开启TensorRT
    USE_TRT: 0
    # 如果开启TensorRT, 使用的精度, 支持FP16, FP32, INT8三个值
    TRT_MODE: FP16

修改字段MODEL_PATH的值为你在上一步下载并解压的模型文件所放置的目录即可。更多配置文件字段介绍,请参考文档预测部署方案配置文件说明

注意在使用CPU版本预测库时,USE_GPU的值必须设为0,否则无法正常预测。

4.3. 执行预测

在终端中切换到生成的可执行文件所在目录为当前目录(Windows系统为cmd)。

Linux 系统中执行以下命令:

./detection_demo --conf=conf/detection_rcnn.yaml --input_dir=images/detection_rcnn

Windows 中执行以下命令:

.\detection_demo.exe --conf=conf\detection_rcnn.yaml --input_dir=images\detection_rcnn\

预测使用的两个命令参数说明如下:

参数 含义
conf 模型配置的Yaml文件路径
input_dir 需要预测的图片目录

· 配置文件说明请参考上一步,样例程序会扫描input_dir目录下的所有图片,并为每一张图片生成对应的预测结果,输出到屏幕,并在X同一目录下保存到X.pb文件(X为对应图片的文件名)。可使用工具脚本vis.py将检测结果可视化。

检测结果可视化

运行可视化脚本时,只需输入命令行参数图片路径、检测结果pb文件路径、目标框阈值以及类别-标签映射文件路径即可得到可视化的图片X.png (tools目录下提供coco17的类别标签映射文件coco17.json)。

python vis.py --img_path=../build/images/detection_rcnn/000000087038.jpg --img_result_path=../build/images/detection_rcnn/000000087038.jpg.pb --threshold=0.1 --c2l_path=coco17.json

检测结果(每个图片的结果用空行隔开)

原图:

原图

检测结果图:

检测结果