OpenMV实战案例：基于形状检测的入门应用-智慧文博士

从零开始玩转OpenMV：用形状识别点亮你的第一个视觉项目

你有没有想过，让一个小车自己“看见”地上的标志并停下？或者让一台小机器自动分拣出三角形和圆形的零件？听起来像是高大上的人工智能，但其实——只要一块OpenMV模块，再加几十行代码，就能实现。

今天我们就来动手做一个基于形状检测的入门级视觉系统，不讲空话、不堆术语，带你一步步把摄像头变成“眼睛”，让它能认出三角形、矩形、圆形……甚至八边形停止牌！这不仅是炫技，更是通向智能感知世界的第一步。

为什么是OpenMV？因为它真的够“轻”

在很多人印象里，机器视觉=电脑+相机+OpenCV+一堆报错的Python环境。没错，传统方案确实强大，但也太重了：功耗高、体积大、调试复杂，连部署都像在搬砖。

而OpenMV不一样。它是一块比硬币大不了多少的小板子，却集成了摄像头、处理器、内存和MicroPython运行环境。你可以把它插上USB线，打开IDE，写几行代码，立刻看到实时画面中的识别结果——整个过程就像在玩Arduino一样简单。

它的核心是一颗STM32H7系列MCU，主频高达480MHz，在QVGA分辨率下也能跑出接近60fps的处理速度。更关键的是，它原生支持MicroPython，这意味着：

不用编译，改完代码直接运行；
语法简洁，初学者也能快速上手；
内置丰富的图像处理函数库，比如img.binary()、find_contours()，几乎就是为视觉任务量身定制的。

所以如果你是个学生、创客，或是想快速验证一个自动化点子的工程师，OpenMV就是那个“刚刚好”的工具。

形状识别是怎么做到的？拆解背后的技术链

我们常说“识别形状”，但计算机可不懂什么叫“看起来像个三角”。它只能数像素、算轮廓、看角度。那么OpenMV是如何把一串二进制数据变成“这是个三角形”的判断呢？

别急，我们来拆开这个黑箱，看看背后的完整流程。

第一步：拍张照，然后“黑白化”

任何视觉任务的第一步都是采集图像。OpenMV默认使用RGB565格式，也就是每帧图像是彩色的。但颜色太多反而干扰判断，尤其是我们要识别的是几何结构而不是颜色本身。

所以第一步通常是转成灰度图或直接做二值化处理（即黑白图）。这样每个像素只有两种状态：0（黑）表示背景，255（白）表示前景目标。

img = sensor.snapshot() binary_img = img.binary([(0, 60, 0, 120, 0, 120)]) # LAB空间阈值分割

这里的(0, 60, 0, 120, 0, 120)是LAB色彩空间下的阈值范围，专门用来抓取深色物体。你可以理解为：“只要是偏暗的颜色，统统标成白色（前景），其余归为黑色”。

⚠️ 小贴士：关闭自动增益和白平衡非常重要！否则每次光照变化都会导致阈值失效。固定参数才能稳定识别。

第二步：清理噪点，让轮廓更干净

原始二值图往往有很多毛刺、小斑点，这些噪声会影响后续轮廓提取。这时候就要请出形态学操作——腐蚀（erode）和膨胀（dilate）。

腐蚀：去掉孤立的小亮点；
膨胀：填补目标内部的小空洞；

两者结合使用，相当于给图像“美颜”一下：

binary_img.erode(1) binary_img.dilate(1)

虽然只是两行代码，但在实际项目中能显著提升识别准确率。

第三步：找轮廓 → 数角 → 判形状

这才是重头戏。

OpenMV提供了find_contours()函数，可以自动找出图像中所有闭合的边界线。每一个“轮廓”就是一个潜在的目标。

然后我们对每个轮廓进行多边形逼近（Polyline Approximation），也就是用最少的直线段去拟合这条曲线。算法会返回一组顶点坐标，而顶点的数量，正是判断形状的关键！

line = cnt.approximate_polygon(max_corners=20, epsilon=0.02) if len(line) == 3: shape_name = "Triangle" elif len(line) == 4: shape_name = "Rectangle" else: shape_name = "Circle"

是不是很简单？说白了，这就是个“数角游戏”：

三个角 → 三角形；
四个角 → 四边形（可进一步判断是否为矩形）；
八个角 → 很可能是停止标志；
十多个角还很圆滑？那基本就是圆了。

当然，现实没那么理想。透视变形、轻微遮挡、边缘模糊都会让角点数量波动。所以我们还需要一些“保险机制”：

增强策略	作用
`pixels_threshold=100`	排除面积太小的噪点
`cnt.is_convex()`	检查是否为凸多边形，排除异形干扰
连续多帧确认	防止瞬时误检触发动作

这些技巧看似微不足道，但在真实场景中往往是成败的关键。

实战代码来了！复制粘贴就能跑

下面这段代码已经过实测，可在OpenMV IDE中直接运行。建议先用打印纸画几个标准图形放在浅色桌面上测试。

import sensor import image import time # 初始化摄像头 sensor.reset() sensor.set_pixformat(sensor.RGB565) sensor.set_framesize(sensor.QVGA) # 可降为QQVGA提速 sensor.skip_frames(time=2000) sensor.set_auto_gain(False) sensor.set_auto_whitebal(False) # 设置深色目标的LAB阈值（适用于黑/灰图形） threshold = (0, 60, 0, 120, 0, 120) clock = time.clock() while True: clock.tick() img = sensor.snapshot() # 二值化 + 去噪 img.binary([threshold]) img.erode(1) img.dilate(1) # 查找有效轮廓（设定最小面积） contours = img.find_contours( threshold_list=[(100, 16000)], # 面积阈值 pixels_threshold=100, area_threshold=100 ) for cnt in contours: # 多边形逼近 line = cnt.approximate_polygon(max_corners=20, epsilon=0.02) corners = len(line) if corners < 3: continue # 根据角点数分类 if corners == 3: label = "Tri" elif corners == 4: label = "Rect" elif 5 <= corners <= 8: label = f"Poly{corners}" else: label = "Circle" # 在图像上标注 img.draw_contour(cnt, color=(255, 0, 0)) x, y = cnt.x(), cnt.y() img.draw_string(x, y, label, color=(0, 255, 0), scale=2) # 串口输出信息 print("Found %s at (%d,%d), Corners: %d" % (label, x, y, corners)) # 显示帧率 print("FPS: %.2f" % clock.fps())

运行后你会在IDE窗口看到实时画面，框出的轮廓和标签一目了然，同时串口不断输出识别结果。恭喜你，已经拥有了第一套视觉感知系统！

能做什么？这些应用你绝对想不到

别以为这只是个教学demo。这套技术完全可以落地到真实项目中：

🚗 场景一：智能小车自动停车

在地上贴一个八边形STOP标志，小车行驶过程中一旦识别到该图案，立即刹车。无需GPS、激光雷达，成本不到百元。

🏭 场景二：产线零件分拣

传送带上不同形状的工件依次通过视野区域，OpenMV识别后发送信号给PLC控制气缸推入对应料槽。适合教育演示或小型自动化设备。

🔔 场景三：交互式装置

博物馆展台前放置不同形状卡片，观众举起卡片即可触发语音讲解或灯光效果。比RFID更直观，比触摸屏更有趣。

甚至你可以把它装在机械臂前端，实现“看到哪个拿哪个”的基础抓取逻辑。

遇到问题怎么办？老司机给你避坑指南

刚上手难免踩坑，以下是几个高频问题及应对方法：

❓ 为什么总是识别不到？明明就在画面里！

→ 检查三点：
1.光照是否均匀？强光反光会导致局部过曝。
2.颜色对比是否足够？试试换成红底白字或黑底黄图。
3.阈值设对了吗？在IDE里用滑块工具动态调整LAB值，找到最佳区间。

❓ 三角形被识别成四边形？

→ 提高轮廓近似的精度：

cnt.approximate_polygon(epsilon=0.01) # 更精细的逼近

同时增加面积筛选，避免边缘毛刺形成伪角点。

❓ 处理太慢，跟不上移动目标？

→ 优化方向：
- 改用QQVGA分辨率（160x120）；
- 设置roi=(80, 60, 160, 120)只关注中心区域；
- 关闭不必要的绘图操作（如draw_string）用于量产版。

合理配置下，处理延迟可压到30ms以内，完全满足低速动态场景需求。

写在最后：从“看得见”到“想得清”

今天我们完成了一个完整的闭环：
感知（拍照）→ 分析（处理）→ 决策（判断）→ 输出（通信/显示）

而这，正是所有智能系统的底层范式。

也许你现在只是让OpenMV认了个三角形，但下一步就可以让它读二维码、识别人脸、跟踪颜色球，甚至结合神经网络模型做简单分类。OpenMV H7 Plus 已经支持TensorFlow Lite推理，意味着你可以在MCU上跑轻量级CNN。

更重要的是，这个过程教会你一种思维方式：如何把抽象的需求拆解成可执行的技术步骤。

下次当你看到某个自动化设备时，不妨问一句：
“它是不是也可以用一块OpenMV+一段脚本搞定？”

毕竟，伟大的创新往往始于一个简单的想法，和一次勇敢的尝试。

📌互动时间：你在哪些场景中用过OpenMV？或者有什么想实现但还没动手的点子？欢迎留言交流，我们一起头脑风暴！

OpenMV实战案例：基于形状检测的入门应用