数学形态学在目标检测中的应用研究文献综述

 2023-09-25 08:20:27

文献综述

本课题研究的现状及发展趋势

喷码自动检测是图像处理领域的一个重要课题,在我们的生活中,大量的喷码字符随处可见,而又由于其为不连续的点状字符,如何快速而有效地识别也成为当今一大热点。目前喷码字符的识别技术研究主要集中于两个方面:一是预处理方法的研究,为了满足识别的高实时性要求,预处理的过程尽可能的简单而高效;二是对于特征提取方法的研究,目前来说,特征提取的方法多为传统的结构特征、统计特征,这些特征对于传统的印刷字符识别效果较好,但是对于易断裂、易扭曲的喷码字符,识别效果不佳[1]。因此,本课题主要研究如何利用数学形态学对产品包装上的喷码进行识别,从而提高产品生产与检测流水线的工作精度与工作效率,以适应未来更高精度的应用环境。

数学形态学是一门建立在严格数学理论基础上的学科,是几何形态学分析和描述的重要工具。自法国的Matheron和 Serra等人将数学形态学引入图像处理领域以来,经过许多人在理论和应用方面的研究,使得其在图像处理各领域的实际应用非常广泛[2-4]。近年来,数学形态学已在数字图像处理、计算机视觉、信号处理、模式识别、计算方法与数据处理等方面得到了极为广泛的应用,是计算机科学的研究热门之一[5][6]。从某种意义上讲,数学形态学实际上构成了一种用于数字图像处理与识别的新理论和新方法。

喷码检测的发展方向为更加快速而正确地识别喷码字符,而识别喷码字符主要分为四个阶段:一是预处理阶段,主要包括对图像进行去噪、滤波、增强、二值化等过程。二是图像分割[5]阶段,主要包括双排字符分割与单个字符分割[7]。三是特征提取阶段,主要包括外部轮廓特征、统计特征和结构特征。四是字符识别阶段。本次设计将会在正确识别字符的基础之上,努力提高字符识别的速度。

喷码检测作为产品生产流水线上的重要一环,因此,喷码检测的速度,正确率对产品厂家来说至关重要,为减小误差,应对图像进行预处理。对于图像增强,主要集中于图像滤波这一方面,目前常用的滤波算法为均值滤波、中值滤波等,而中值滤波相对于均值滤波来说耗时较少,对噪声相对敏感,因此采用中值滤波算法。对于待检测的图像,并不是所有的图像都是二值图像,因此应对图像进行二值化处理,而二值化的关键在于阈值的选择,目前常用的阈值选择法主要有全局阈值法(包括直方图法[8])、局部阈值法、动态阈值法等,阈值的选择对字符的二值化处理至关重要,因此本课题将采用局部Otsu聚类法[9]确定阈值。除此之外,大多数的图像还存在旋转与平移,又目标检测增加了难度,所以要对图像进行校正,目前常用的校正方法有霍夫变换和相位相关[10]、频域相关技术[11]、旋转图像匹配算法[12]等,本课题中将采用仿射变换来进行喷码图像的旋转矫正。

在图像分割阶段应注意的是该分割过程包括喷码字符与背景的分割和喷码字符之间的分割[7]两部分,如何得到最佳的分割效果是本课题研究的一个重要环节。目前的图像分割方法主要有基于模糊数学的图像分割[13]、数学形态学的图像分割[14]等。常见的图像分割算法有阈值分割技术[15]、边缘检测[6]、区域生长法[16]等。为提高图像分割的准确性,本课题将采用投影法进行二值图像分割。

在特征提取阶段应注意文字具有明显的方向特性,因此提取方向特征是最有效的特征提取方式之一,其中以方向线素特征、Gabor 特征、梯度特征为代表[17]。目前特征提取的方法多为传统的结构特征、统计特征,但是这些方法对不连续的喷码字符来说效果不明显,因此本次课题将采用外部轮廓特征、统计特征和结构特征相结合的特征提取方式,以期达到理想结果。

最后一步为字符识别,目前现有的字符识别主要有神经网络方法、模板匹配方法、传统OCR方法[9]。为了提高字符识别的准确率,本课题将采用直方图梯度图(HOG)描述符,使用定向梯度柱的直方图的方法来进行字符识别[18]

本课题研究的意义和价值

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。