K230 CanMV nncase_runtime 使用说明#

前言#

概述#

此文档介绍CanMV nncase_runtime模块,用于指导开发人员使用MicroPython调用KPU和AI2D模块。

读者对象#

本文档(本指南)主要适用于以下人员:

  • 技术支持工程师

  • 软件开发工程师

缩略词定义#

简称

说明

修订记录#

文档版本号

修改说明

修改者

日期

V1.0

初版

杨浩琪

2023-11-21

1. 概述#

此文档介绍CanMV nncase_runtime模块如何使用。

2. 功能介绍#

2.1. 导入库#

import nncase_runtime as nn
import ulab.numpy as np

2.2. KPU初始化#

初始化模型推理模块

kpu = nn.kpu()

2.3. AI2D初始化#

初始化图像处理模块

ai2d = nn.ai2d()

2.4. 读取模型#

读取模型有两种方式,一种是通过文件路径,一种是通过二进制数据。

# 文件路径
model = nn.load_model('test.kmodel')

# 二进制数据
with open("test.kmodel", "rb") as f:
    data = f.read()
    kpu.load_kmodel(data)

2.5. 单独使用KPU进行推理#

2.5.1. 设置模型输入#

开始模型推理前,需要设置对应的模型输入数据

data = np.zeros((1,3,320,320),dtype=np.uint8)
kpu_input = nn.from_numpy(data)
kpu.set_input_tensor(0, kpu_input)

# 模型存在多个输入
kpu.set_input_tensor(1, kpu_input_1)
kpu.set_input_tensor(2, kpu_input_2)

2.5.2. 执行推理并获取推理结果#

kpu.run()

result = kpu.get_output_tensor(i) # 返回第i个输出tensor
data = result.to_numpy() # 将输出tensor转换为numpy对象

2.6. 使用AI2D+KPU进行推理#

这里使用AI2D对图像进行预处理,然后使用KPU进行推理。如果使用摄像头等输入设备,请参考AI Demo示例说明

2.6.1. 配置AI2D参数#

AI2D功能有:cropshiftpadresizeaffine。可以根据实际需求配置对应的参数,不使用的功能不需要配置。 各个场景的不同用法请参考AI demo中第三章<<三、AI Demo多模型示例解析>>。

# 基础配置: 输入、输出layout,输入、输出dtype
ai2d.set_dtype(nncase_runtime.ai2d_format.NCHW_FMT,
               nncase_runtime.ai2d_format.NCHW_FMT, 
               np.uint8, np.uint8)
             
# 功能配置,以pad和resize为例
ai2d.set_pad_param(True, [0,0,0,0,1,1,2,2], 0, [127,127,127])
ai2d.set_resize_param(True, nn.interp_method.tf_bilinear, nn.interp_mode.half_pixel)

# 执行配置,需要配置输入、输出shape
ai2d_builder = ai2d.build([1,3,224,224], [1,3,256,256])

2.6.2. 串行使用AI2D和KPU#

data = np.zeros((1,3,224,224),dtype=np.uint8)
ai2d_input = nn.from_numpy(data)

# 获取KPU的输入tensor
kpu_input = kpu.get_input_tensor(0)

# 将KPU的输入tensor设置为ai2d的输出
ai2d_builder.run(ai2d_input, kpu_input)
kpu.run()

# 获取KPU的输出tensor
result = kpu.get_output_tensor(i) # 返回第i个输出tensor
data = result.to_numpy() # 将输出tensor转换为numpy对象

2.7. 释放内存#

如果定义了global变量,则需要确保在程序结束前,所有global变量的引用计数为0,否则无法释放内存。

import nncase_runtime as nn
import gc

del kpu
del ai2d
del ai2d_builder

# tensor = nn.from_numpy()
del tensor

# input_tensor = kpu.get_input_tensor(i)
del input_tensor

# output_tensor = kpu.get_output_tensor(i)
del output_tensor

gc.collect()
nn.shrink_memory_pool()