4.1 nncase_runtime 模块 API 手册#

1. 概述#

本手册旨在介绍 CanMV 平台的 nncase_runtime 模块,指导开发人员在 MicroPython 环境下调用 KPU(神经网络处理单元)及 AI2D 模块,以实现高效的深度学习推理和图像处理功能。

2. API 介绍#

2.1 from_numpy#

描述

该函数用于从 MicroPython 中的 ulab.numpy 对象创建 runtime_tensor。

语法

runtime_tensor = nncase_runtime.from_numpy(ulab.numpy)

参数

参数名称

描述

输入/输出

ulab.numpy

numpy 对象

输入

返回值

返回值

描述

runtime_tensor

返回创建的 runtime_tensor 对象。

其他

如果失败,将抛出 C++ 异常。

2.2 to_numpy#

描述

将 runtime_tensor 对象转换为 ulab.numpy 对象。

语法

runtime_tensor = kpu.get_output_tensor(0)
result = runtime_tensor.to_numpy()

参数

无。

返回值

返回值

描述

ulab.numpy

返回从 runtime_tensor 转换后的 ulab.numpy 对象。

其他

如果失败,将抛出 C++ 异常。

2.3 nncase_runtime.kpu#

kpu 模块提供了用于调用 KPU 硬件执行神经网络模型推理的基本功能,包括加载模型、设置输入数据、执行推理及获取输出结果等。

2.3.1 load_kmodel#

描述

加载编译生成的 kmodel 格式的神经网络模型。

语法

load_kmodel(read_bin)
load_kmodel(path)

参数

参数名称

描述

输入/输出

read_bin

kmodel 的二进制内容

输入

path

kmodel 的文件路径

输入

返回值

返回值

描述

加载成功。

其他

如果失败,将抛出 C++ 异常。

2.3.2 set_input_tensor#

描述

设置 kmodel 推理时的输入 runtime_tensor。

语法

set_input_tensor(index, runtime_tensor)

参数

参数名称

描述

输入/输出

index

kmodel 的输入索引

输入

runtime_tensor

包含输入数据信息的 tensor

输入

返回值

返回值

描述

设置成功。

其他

如果失败,将抛出 C++ 异常。

2.3.3 get_input_tensor#

描述

获取 kmodel 推理时的输入 runtime_tensor。

语法

get_input_tensor(index)

参数

参数名称

描述

输入/输出

index

kmodel 的输入索引

输入

返回值

返回值

描述

runtime_tensor

包含输入数据信息的 tensor。

其他

如果失败,将抛出 C++ 异常。

2.3.4 set_output_tensor#

描述

设置 kmodel 推理后的输出结果。

语法

set_output_tensor(index, runtime_tensor)

参数

参数名称

描述

输入/输出

index

kmodel 的输出索引

输入

runtime_tensor

输出结果的 tensor

输入

返回值

返回值

描述

设置成功。

其他

如果失败,将抛出 C++ 异常。

2.3.5 get_output_tensor#

描述

获取 kmodel 推理后的输出结果。

语法

get_output_tensor(index)

参数

参数名称

描述

输入/输出

index

kmodel 的输出索引

输入

返回值

返回值

描述

runtime_tensor

获取第 index 个输出的 runtime_tensor。

其他

如果失败,将抛出 C++ 异常。

2.3.6 run#

描述

启动 kmodel 推理过程。

语法

run()

返回值

返回值

描述

推理成功

其他

如果失败,将抛出 C++ 异常。

2.3.7 inputs_size#

描述

获取 kmodel 的输入个数。

语法

inputs_size()

返回值

返回值

描述

size_t

kmodel 的输入个数。

其他

如果失败,将抛出 C++ 异常。

2.3.8 outputs_size#

描述

获取 kmodel 的输出个数。

语法

outputs_size()

返回值

返回值

描述

size_t

kmodel 的输出个数。

其他

如果失败,将抛出 C++ 异常。

2.3.9 get_input_desc#

描述

获取指定索引的输入描述信息。

语法

get_input_desc(index)

参数

参数名称

描述

输入/输出

index

kmodel 的输入索引

输入

返回值

返回值

描述

MemoryRange

第 index 个输入的信息,包括 dtype, start, size

2.3.10 get_output_desc#

描述

获取指定索引的输出描述信息。

语法

get_output_desc(index)

参数

参数名称

描述

输入/输出

index

kmodel 的输出索引

输入

返回值

返回值

描述

MemoryRange

第 index 个输出的信息,包括 dtype, start, size

2.4 nncase_runtime.ai2d#

2.4.1 build#

描述

构造 ai2d_builder 对象。

语法

build(input_shape, output_shape)

参数

名称

描述

input_shape

输入形状

output_shape

输出形状

返回值

返回值

描述

ai2d_builder

返回用于执行的 ai2d_builder 对象。

其他

如果失败,将抛出 C++ 异常。

2.4.2 run#

描述

配置寄存器并启动 AI2D 计算。

语法

ai2d_builder.run(input_tensor, output_tensor)

参数

名称

描述

input_tensor

输入 tensor

output_tensor

输出 tensor

返回值

返回值

描述

成功。

其他

如果失败,将抛出 C++ 异常。

2.4.3 set_dtype#

描述

设置 AI2D 计算过程中的数据类型。

语法

set_dtype(src_format, dst_format, src_type, dst_type)

参数

名称

类型

描述

src_format

ai2d_format

输入数据格式

dst_format

ai2d_format

输出数据格式

src_type

datatype_t

输入数据类型

dst_type

datatype_t

输出数据类型

2.4.4 set_crop_param#

描述

配置裁剪相关参数。

语法

set_crop_param(crop_flag, start_x, start_y, width, height)

参数

| 名称 | 类型 | 描述 | | ——— |

—- | —————— | | crop_flag | bool | 是否启用裁剪功能 | | start_x | int | 宽度方向的起始像素 | | start_y | int | 高度方向的起始像素 | | width | int | 宽度 | | height | int | 高度 |

2.5 nncase_runtime 其他功能#

  • 图像处理功能:
    nncase_runtime 还提供了多种图像处理功能,包括图像缩放、旋转、翻转等。

  • 深度学习推理:
    该模块支持多种深度学习模型的推理,具有良好的兼容性。

3. 参考示例#

import os
import ujson
import nncase_runtime as nn
import ulab.numpy as np
import image
import sys

# 加载kmodel
kmodel_path="/sdcard/examples/kmodel/face_detection_320.kmodel"
kpu=nn.kpu()
kpu.load_kmodel(kmodel_path)

# 读取一张图片,并将其transpose成chw数据
img_path="/sdcard/examples/utils/db_img/id_1.jpg"
img_data = image.Image(img_path).to_rgb888()
img_hwc=img_data.to_numpy_ref()
shape=img_hwc.shape
img_tmp = img_hwc.reshape((shape[0] * shape[1], shape[2]))
img_tmp_trans = img_tmp.transpose().copy()
img_chw=img_tmp_trans.reshape((shape[2],shape[0],shape[1]))

# 初始化ai2d预处理,并运行ai2d预处理,输出模型输入分辨率320*320
ai2d=nn.ai2d()
output_data = np.ones((1,3,320,320),dtype=np.uint8)
ai2d_output_tensor = nn.from_numpy(output_data)
ai2d.set_dtype(nn.ai2d_format.NCHW_FMT, nn.ai2d_format.NCHW_FMT, np.uint8, np.uint8)
ai2d.set_resize_param(True,nn.interp_method.tf_bilinear, nn.interp_mode.half_pixel)
ai2d_builder = ai2d.build([1,3,img_chw.shape[1],img_chw.shape[2]], [1,3,320,320])   
ai2d_input_tensor = nn.from_numpy(img_chw)
ai2d_builder.run(ai2d_input_tensor, ai2d_output_tensor)

# kmodel运行,并获取输出,输出从tensor转成ulab.numpy.ndarray数据
kpu.set_input_tensor(0, ai2d_output_tensor)
kpu.run()
for i in range(kpu.outputs_size()):
    output_data = kpu.get_output_tensor(i)
    result = output_data.to_numpy()
    print(result.shape)

4. 结论#

通过使用 nncase_runtime 模块,开发人员能够在 CanMV 平台上实现高效的深度学习推理和图像处理功能。本手册提供了 API 的详细描述和使用示例,旨在帮助开发人员快速上手并高效开发相关应用。