7. 特征值检测例程讲解#

1. 概述#

在 OpenMV 中,find_hogfind_linesfind_rectsfind_featuresget_regression 是一些用于图像处理和特征检测的函数。

CanMV支持OpenMV算法,同样可以使用这些函数

2. 函数说明#

2.1 find_hog#

find_hog 函数用于在图像中检测使用 HOG (Histogram of Oriented Gradients) 特征描述符的物体。HOG 是一种常用于对象检测的特征描述方法。

  • 语法

objects = img.find_hog(roi=None, threshold=0.5, min_size=(0, 0))
  • 参数解释

    • roi: 可选参数,定义了一个感兴趣区域 (Region of Interest)。默认值为 None,表示在整个图像上进行检测。

    • threshold: 置信度阈值。只有置信度大于这个值的检测结果才会被返回。默认值是 0.5

    • min_size: 最小检测对象的大小。指定为 (width, height) 的元组。默认值是 (0, 0),表示没有最小大小限制。

  • 返回值

返回一个包含检测到的对象的列表,每个对象是一个 Rect 对象,包含了对象的位置和大小。

2.2 find_lines#

find_lines 函数用于在图像中检测直线。该函数适用于寻找图像中的长直线。

  • 语法

lines = img.find_lines(threshold=1000, theta_margin=20, rho_margin=20)
  • 参数解释

    • threshold: 直线的最小长度。检测到的直线必须超过这个长度。默认值是 1000

    • theta_margin: 角度的容忍度。单位是度。默认值是 20

    • rho_margin: 距离的容忍度。单位是像素。默认值是 20

  • 返回值

    返回一个包含直线信息的列表。每条直线是一个 Line 对象,包含了直线的起点、终点、长度和角度。

2.3 find_rects#

find_rects 函数用于检测图像中的矩形区域。这个函数可以用于找到图像中的方形或矩形物体。

  • 语法

rects = img.find_rects(threshold=2000, margin=10)
  • 参数解释

    • threshold: 矩形的最小面积。默认值是 2000

    • margin: 矩形检测的边距容忍度。默认值是 10

  • 返回值

    返回一个包含矩形信息的列表。每个矩形是一个 Rect 对象,包含矩形的坐标和大小。

2.4 find_features#

find_features 函数用于检测图像中的特征点。这些特征点可以用于图像匹配、跟踪等任务。

  • 语法

features = img.find_features(algorithm, threshold=10)
  • 参数解释

    • algorithm: 要使用的特征检测算法。常见的算法包括 image.FORBIDDENimage.BRIEF 等。

    • threshold: 特征检测的阈值。默认值是 10

  • 返回值

    返回一个包含特征点信息的列表。每个特征点是一个 Feature 对象,包含了特征点的位置和其他信息。

2.5 get_regression#

get_regression 函数用于从图像中检测回归线,即拟合数据点的直线。通常用于标记数据的趋势或方向。

  • 语法

line = img.get_regression(threshold=1000, min_length=10, max_distance=5)
  • 参数解释

    • threshold:直线的最小长度。默认值是 1000

    • min_length: 拟合线的最小长度。默认值是 10

    • max_distance: 允许的数据点到回归线的最大距离。默认值是 5

  • 返回值

    返回一个包含回归线信息的 Line 对象,表示拟合的直线。

2.6 总结#

这些函数是 OpenMV 图像处理库中的重要工具,分别用于不同的视觉任务:

  • find_hog: 基于 HOG 特征检测物体。

  • find_lines: 检测图像中的直线。

  • find_rects: 检测图像中的矩形区域。

  • find_features: 检测图像中的特征点。

  • get_regression: 检测图像中的回归线。

3. 示例#

这里只列举一个寻找线段的demo,具体demo还请查看固件自带虚拟U盘中的例程

# 直线检测示例
#
# 这个示例展示了如何在图像中找到直线。对于在图像中找到的每个直线对象,
# 将返回一个包含该直线旋转的直线对象。

# 注意:直线检测是通过霍夫变换完成的:
# http://en.wikipedia.org/wiki/Hough_transform
# 请阅读上述链接以获取有关 `theta` 和 `rho` 的更多信息。

# find_lines() 找到的是无限长的直线。使用 find_line_segments() 可以找到非无限长的直线。
import time, os, gc, sys

from media.sensor import *
from media.display import *
from media.media import *

DETECT_WIDTH = ALIGN_UP(640, 16)
DETECT_HEIGHT = 480

# 所有的直线对象都有一个 `theta()` 方法来获取其旋转角度(以度为单位)。
# 你可以根据其旋转角度来过滤直线。

min_degree = 0
max_degree = 179

# 所有的直线对象还有 `x1()`, `y1()`, `x2()`, 和 `y2()` 方法来获取它们的端点,
# 以及一个 `line()` 方法来将上述所有值作为一个包含 4 个值的元组返回给 `draw_line()` 使用。

# 关于负的 rho 值:
#
# 一个 [theta+0:-rho] 元组与 [theta+180:+rho] 是一样的。
sensor = None

def camera_init():
    global sensor

    # 使用默认配置构造一个Sensor对象
    sensor = Sensor(width=DETECT_WIDTH,height=DETECT_HEIGHT)
    # sensor复位
    sensor.reset()
    # 设置水平镜像
    # sensor.set_hmirror(False)
    # 设置垂直翻转
    # sensor.set_vflip(False)

    # 设置通道 0 输出大小
    sensor.set_framesize(width=DETECT_WIDTH,height=DETECT_HEIGHT)
    # 设置通道 0 输出格式
    sensor.set_pixformat(Sensor.GRAYSCALE)
    # 使用 IDE 作为显示输出,如果您选择的屏幕无法点亮,请参考API文档中的K230_CanMV_Display模块API手册自行配置
    Display.init(Display.VIRT, width= DETECT_WIDTH, height = DETECT_HEIGHT,fps=100,to_ide = True)
    # 初始化媒体管理器
    MediaManager.init()
    # sensor开始运行
    sensor.run()

def camera_deinit():
    global sensor
    # sensor停止运行
    sensor.stop()
    # 销毁显示
    Display.deinit()
    # 休眠
    os.exitpoint(os.EXITPOINT_ENABLE_SLEEP)
    time.sleep_ms(100)
    # 释放媒体缓冲区
    MediaManager.deinit()

def capture_picture():

    fps = time.clock()
    while True:
        fps.tick()
        try:
            os.exitpoint()
            global sensor
            img = sensor.snapshot()

            # `threshold` 控制在图像中找到的直线数量。只有边缘差异幅度和大于 `threshold` 的直线才会被检测到。

            # 关于 `threshold` 的更多信息 - 图像中的每个像素都会为直线贡献一个幅度值。
            # 所有贡献的总和就是该直线的幅度。然后,当直线合并时,它们的幅度会被相加。
            # 注意,`threshold` 会在合并前过滤掉低幅度的直线。要查看未合并直线的幅度,请将 `theta_margin` 和 `rho_margin` 设置为 0。

            # `theta_margin` 和 `rho_margin` 控制合并相似的直线。如果两条直线的 theta 和 rho 值差异小于该边界,它们会被合并。

            for l in img.find_lines(threshold = 1000, theta_margin = 25, rho_margin = 25):
                if (min_degree <= l.theta()) and (l.theta() <= max_degree):
                    img.draw_line([v for v in l.line()], color = (255, 0, 0))
                    print(l)

            # 将结果绘制到屏幕上
            Display.show_image(img)
            img = None

            gc.collect()
            #print(fps.fps())
        except KeyboardInterrupt as e:
            print("user stop: ", e)
            break
        except BaseException as e:
            print(f"Exception {e}")
            break

def main():
    os.exitpoint(os.EXITPOINT_ENABLE)
    camera_is_init = False
    try:
        print("camera init")
        camera_init()
        camera_is_init = True
        print("camera capture")
        capture_picture()
    except Exception as e:
        print(f"Exception {e}")
    finally:
        if camera_is_init:
            print("camera deinit")
            camera_deinit()

if __name__ == "__main__":
    main()

提示

具体接口定义请参考 image