机器视觉如何推动自动化


作者:乔迪·穆拉纳
机器视觉是一系列技术,这些技术使自动化设备(工业或其他)从图像中对直接环境有高度的了解。如果没有机器视觉软件,数字图像将只不过是简单的未连接的像素集合,具有各种颜色值和色调强度。机器视觉允许计算机(通常连接到机器控制)检测此类图像中的边缘和形状,从而让更高级别的处理例程识别预定义的感兴趣对象。从这个意义上说,图像不一定仅限于可见光谱中的摄影图像;它们还可以包括使用红外、激光、X 射线和超声波信号获得的图像。

图 1:机器视觉在更复杂的机器人应用中的使用正在增加。(图片来源: 约翰6863373 |Dreamstime.com)
工业环境中一个相当常见的机器视觉应用是识别箱中的特定零件,其中包含随机排列(混乱)的零件混合物。在这里,机器视觉可以帮助拾取和放置机器人自动拾取正确的零件。当然,如果这些部件在托盘上以相同的方式整齐排列和定向,那么通过成像反馈识别这些部件将相对简单。然而,强大的机器视觉算法可以识别距离相机不同距离的物体(因此在成像传感器上显示为不同的尺寸)以及不同方向的物体。
最先进的机器视觉系统使新兴设计变得比垃圾箱拣选复杂得多——例如,也许不会比自动驾驶汽车更容易识别。

图 2:机器视觉使系统(工业或其他)能够从图像中对环境设置进行高级理解。(图片来源: 维基媒体)
机器视觉相关技术
术语 机器视觉 有时保留用于参考从图像中提取信息的更成熟和有效的数学方法。相比之下,术语 计算机视觉 通常描述更现代和计算要求更高的系统,包括使用机器学习或人工智能 (AI) 的黑盒方法。然而,机器视觉也可以作为一个包罗万象的术语,涵盖从图像中提取高级信息的所有方法;在这种情况下,计算机视觉描述了其基本的操作理论。
从图像中提取高级意义的技术比比皆是。在研究界,这些技术通常被认为与机器视觉不同。然而,在实际意义上,所有这些都是实现机器视觉的不同方式......在许多情况下,它们重叠。
数字图像处理 是一种涉及图像增强、恢复、编码和压缩的数字信号处理形式。与模拟图像处理相比,其优势包括噪声和失真最小化,以及更多算法的可用性。早期的图像增强用途之一是对第一个近距离的校正 月球表面的图像.这使用了摄影测量映射以及噪声滤波器和校正,以校正成像相机与月球表面对齐引起的几何失真。

图 3:该 DLPC350 集成电路 (IC) 控制器提供输入和输出触发信号,用于将显示的图案与相机同步。它与数字微镜设备(DMD)配合使用,旨在将3D机器视觉传授给工业,医疗和安全设备。事实上,应用包括3D扫描以及计量系统。(图片来源: 德州仪器)
数字图像增强通常涉及增加对比度,并且还可能对视角和镜头失真进行几何校正。压缩通常是通过将复数信号近似为余弦函数的组合来实现的——余弦函数是一种称为离散余弦变换或DCT的傅里叶变换。JPEG文件格式是DCT最流行的应用程序。图像恢复也可以使用傅里叶变换来消除噪点和模糊。
摄影 测量 使用某种特征识别从图像中提取测量值。当从不同位置获得同一场景的多个图像时,这些测量可以包括 3D 信息。最简单的摄影测量系统使用比例尺测量图像中两点之间的距离。为此,通常需要在图像中包含已知的比例参考。
特征检测 允许计算机识别图像中的边角或点。这是摄影测量以及识别物体和运动的必要第一步。斑点检测可以识别边缘过于平滑的区域,无法进行边缘或角落检测。
模式识别 用于标识特定对象。简单来说,这可能意味着在输送机上寻找特定的明确定义的机械部件。
3D 重建 从 2D 图像确定对象的 3D 形式。它可以通过摄影测量方法实现,其中通过三角测量确定共同特征的高度(在不同观察点的图像中识别)。使用单个2D图像也可以进行3D重建;在这里,软件解释(除其他外)阴影边缘或区域之间的几何关系。

图4: 3D扫描仪 捕获对象的 2D 图像以创建其 3D 模型。在某些情况下,数字模型随后用于3D打印副本。(图片来源: 深圳市科实3D科技有限公司)
人类可以轻松地从简单的线条艺术表示中在精神上重建立方体,并从阴影圆圈中重建球体。阴影指示表面的坡度。然而,这种推导的过程比看起来要复杂得多,因为阴影是一维参数,而斜率发生在二维。这可能会导致歧义——这一事实通过描绘物理上不可能的物体的艺术来证明。

图 5:从 2D 图像计算机化确定工件的 3D 形状充满了挑战。
机器视觉任务的排序方式
许多机器视觉系统通过从低级操作开始,然后逐个推进到更高级别的操作来逐步结合上述技术。在最低级别,图像的所有像素都保存为高带宽数据。然后,序列中的每个操作识别图像特征,并用相对较少的数据量表示感兴趣的信息。
首先是图像增强和恢复的低级操作,其次是特征检测。因此,在使用多个传感器的情况下,低级操作可以通过专用于单个传感器的分布式进程执行。一旦检测到单个图像中的特征,就可以进行更高级别的摄影测量 - 任何物体识别或其他依赖于来自多个图像和传感器的组合数据的任务也是如此。
直接计算和学习算法
一个 直接计算 在机器视觉的上下文中,是一组由人类程序员手动定义的数学函数。它们接受图像像素值等输入,以生成对象边缘坐标等输出。相比之下,学习算法不是由人类直接编写的,而是通过示例数据集进行训练,将输入与所需的输出相关联。因此,它们充当黑匣子。现在,大多数此类机器学习都采用基于人工神经网络的深度学习来进行计算。

图 6:来自 iVu 系列 可以按类型、尺寸、位置、方向和颜色识别工件。机器视觉组件可以接受集成屏幕、远程HMI或PC的配置和监控。相机、控制器、镜头和灯光都是预先集成的。(图片来源: 邦纳工程公司)
如果基于直接计算,用于工业应用的简单机器学习通常更可靠,计算要求更低。当然,直接计算可以实现的目标有限。例如,它永远不可能希望执行通过面部识别个人所需的高级模式识别,尤其是不能从拥挤的公共空间的视频源中识别个人。相比之下,机器学习可以巧妙地处理此类应用程序。难怪机器学习越来越多地被部署在较低级别的机器视觉操作中,包括图像增强、恢复和特征检测。
改进教学方法(不是算法)
深度学习技术的成熟已经表明,需要改进的不是学习算法本身,而是它们的训练方式。一种这样改进的训练程序称为 以数据为中心的计算机视觉.在这里,深度学习系统接受由数千、数百万甚至数十亿张图像组成的非常大的训练集,然后存储其算法从每张图像中提取的结果信息。这些算法通过练习工作示例来有效地学习,然后参考“答案书”来验证它们是否达到了正确的值。
一个关于数字模式识别早期的古老故事是一个警示故事。美国军方打算使用机器视觉进行目标识别,国防承包商演示可靠地识别了美国制造和俄罗斯制造的坦克。各种坦克都与供应商的航拍照片一个接一个地正确区分。但是,当用五角大楼自己的图片库再次测试时,系统不断给出错误的答案。问题在于,国防承包商的图像都描绘了沙漠中的美国坦克和绿色田野中的俄罗斯坦克。该系统远非识别不同的坦克,而是识别不同颜色的背景。道德?学习算法需要与精心策划的训练数据一起呈现才能有用。
结论:机器人工作单元安全愿景
机器视觉不再是一种利基技术。它在工业应用中的部署增长最快。在这里,最引人注目的发展是机器视觉现在如何补充工业工厂安全系统,当工厂人员在没有安全帽、口罩或其他正确防护设备的情况下进入工作区时,它会发出警报或发出音频通知。机器视觉还可以完成系统,当叉车等移动机械离人太近时发出通知。
这些和类似的机器视觉系统有时可以取代工业机器人周围的硬防护,以实现更高效的操作。它们还可以替换或增强基于轻型防护装置的安全系统,如果工厂工人进入工作单元,该系统只需停止机器。当机器视觉监控工作单元周围的工厂车间时,这些单元中的机器人可能会随着人们的接近而逐渐减速。
随着工业环境设计的发展,以适应协作机器人和其他工作单元设备,这些设备对工厂人员可以安全移动(即使在设备运行时),这些和其他基于机器视觉的系统将成为工厂流程中更常见的部分。
责任编辑:David
【免责声明】
1、本文内容、数据、图表等来源于网络引用或其他公开资料,版权归属原作者、原发表出处。若版权所有方对本文的引用持有异议,请联系拍明(marketing@iczoom.com),本方将及时处理。
2、本文的引用仅供读者交流学习使用,不涉及商业目的。
3、本文内容仅代表作者观点,拍明不对内容的准确性、可靠性或完整性提供明示或暗示的保证。读者阅读本文后做出的决定或行为,是基于自主意愿和独立判断做出的,请读者明确相关结果。
4、如需转载本方拥有版权的文章,请联系拍明(marketing@iczoom.com)注明“转载原因”。未经允许私自转载拍明将保留追究其法律责任的权利。
拍明拥有对此声明的最终解释权。