模型推理 API
hbDNNInfer()
【函数原型】
int32_t hbDNNInfer(hbDNNTaskHandle_t *taskHandle, hbDNNTensor **output, const hbDNNTensor *input, hbDNNHandle_t dnnHandle, hbDNNInferCtrlParam *inferCtrlParam)
【功能描述】
根据输入参数执行推理任务。调用方可以跨函数、跨线程使用返回的 taskHandle
。
【参数】
- [out]
taskHandle
任务句柄指针。 - [in/out]
output
推理任务的输出。 - [in]
input
推理任务的输入。 - [in]
dnnHandle
DNN句柄指针。 - [in]
inferCtrlParam
控制推理任务的参数。
【返回类型】
- 返回
0
则表示API成功执行,否则执行失败。
使用该接口提交任务时应提前将 taskHandle
置为 nullptr
,除非是给指定 taskHandle
追加任务(即使用 inferCtrlParam::more
功能)。
最多支持同时存在32个模型任务。
对于batch模型,允许分开设置输入张量的内存地址。例如:模型的输入validShape/alignedShape为[4, 3, 224, 224], 可以申请四个hbDNNTensor, 每个hbDNNTensor的validShape/alignedShape都设置为[1, 3, 224, 224],存放每个batch的数据。当模型有多个输入时, input
的顺序应为input0[batch0], input0[batch1], ..., inputn[batch0], inputn[batch1], ...。
hbDNNRoiInfer()
【函数原型】
int32_t hbDNNRoiInfer(hbDNNTaskHandle_t *taskHandle, hbDNNTensor **output, const hbDNNTensor *input, hbDNNRoi *rois, int32_t roiCount, hbDNNHandle_t dnnHandle, hbDNNInferCtrlParam *inferCtrlParam)
【功能描述】
根据输入参数执行ROI推理任务。根据输入参数执行ROI推理任务。调用方可以跨函数、跨线程使用返回的 taskHandle
。
【参数】
- [out]
taskHandle
任务句柄指针。 - [in/out]
output
推理任务的输出。 - [in]
input
推理任务的输入。 - [in]
rois
Roi框信息。 - [in]
roiCount
Roi框数量。 - [in]
dnnHandle
dnn句柄指针。 - [in]
inferCtrlParam
控制推理任务的参数。
【返回类型】
- 返回
0
则表示API成功执行,否则执行失败。
若使用 RDK X3 ,请遵循如下规则:
| 该接口支持批处理操作,假设需要推理的数据批数为 batch
,模型输入个数为 input_count
,其中resizer输入源的数量为 resizer_count
。
| 准备输入参数 input
:第i个 batch
对应的 input
数组下标范围是 :math:[i * input\_count
, :math:(i + 1) * input\_count),i=[0,batch)
;
| 准备输入参数 rois
:每个resizer输入源的输入都应匹配一个roi,第i个 batch
对应的 rois
数组下标范围是 :math:[i * resizer\_count
, :math:(i + 1) * resizer\_count),i=[0,batch)
; 每个batch的roi顺序应和输入的顺序保持一致;
| 关于 batch
数量限制:其范围应该在[1, 255];
模型限制:模型需要在编译时将编译参数 input_source
设置为 resizer
, 模型的 h*w 要小于18432;
使用该接口提交任务时应提前将 taskHandle
置为 nullptr
,除非是给指定 taskHandle
追加任务(即使用 inferCtrlParam::more
功能)。
roi
的 left
和 top
必须是偶数, right
和 bottom
必须是奇数。
roi
大小要求是 :math:16 <= width < 256
, :math:16 <= height < 256
。
缩放范围是 :math:0.5 < roi / src <=8
。
最多支持同时存在32个模型任务。
API示例: 可参考X3 模型推理DNN API使用示例说明文档 X5 模型推理DNN API使用示例说明文档 的 roi_infer.sh
说明。
模型限制:在模型转换时,将编译参数 input_source
设置为 {`input_name`: `resizer`}
即可生成resizer模型,具体参数配置细节可参考PTQ量化原理及步骤说明的转换模型中的介绍。
目前也支持多输入的nv12数据,resizer常用的输出尺寸(HxW):128x128、128x64、64x128、160x96
若使用 RDK Ultra ,请遵循如下规则:
input_count
: 模型输入分支数量output_count
: 模型输 出分支数量resizer_count
: 模型输入源为 resizer 的分支数量(≤input_count),模型处理一批数据时,一个 resizer 输入源分支处理一个 roiroiCount
: roi 总数,其数值为batch * resizer_count
data_batch
: 模型需要推理的数据批数,其数值为roiCount / resizer_count
model_batch
: 模型内部的 batch 数量。即模型实际推理时,输入给模型的 batch_size。D-Robotics 工具链支持将模型编译为 batch model
输入/输出示例说明:
以较为复杂的多输入模型为例,假设模型有 3 个输入分支(2个resizer输入源,1个ddr输入源)和 1 个输出分支,并以 batch=2
编译,模型共需处理 3 批数据共 6 个 roi(即每批数据有2个roi),那么现有如下信息:
input_count
= 3output_count
= 1resizer_count
= 2roiCount
= 6data_batch
= 3model_batch
= 2
所以模型推理这 3 批数据需要准备独立地址的 input_tensor 数量为 input_count * data_batch = 9
。
另假设模型输入/输出的静态信息如下:
-
模型输入(model_info):
- tensor_0_resizer: [2, 3, 128, 128]
- tensor_1_resizer: [2, 3, 256, 256]
- tensor_2_ddr: [2, 80, 1, 100]
-
模型输出(model_info):
- tensor_out:[2, 100, 1, 56]
那么模型在推理时的动态信息则为:
-
模型输入(input_tensors):
- [1x3x128x128, 1x3x256x256, 1x80x1x100, 1x3x128x128, 1x3x256x256, 1x80x1x100, 1x3x128x128, 1x3x256x256, 1x80x1x100]
-
模型输出(output_tensors):
- [4x100x1x56]
其中,因为 model_batch = 2