一、文献综述
(一)国内外研究现状
在1960年代,Hubel等人受到猫的大脑皮层神经元启发,开拓性地提出了卷积神经网络(CNN)。该网络经过许多科学家的不断研究逐渐发展壮大。GEHinton等人提出了深度学习的概念,在此基础上派生出许多类型的算法。作为图像处理的基本算法,常用的算法通常有VGG,GoogleNet,ResNet等。例如,VGGnet检查卷积网络的深度和性能之间的关系,通过反复堆叠3 * 3个小的卷积核和2 * 2个最大池化层,可以构建一个16-19层的上深度卷积网络。目标检测算法类似于图像检测算法,但是它的数据更多样化。目标识别算法不仅识别图像中所有感兴趣的对象,而且能标记图像中对象的位置和大小,并以坐标形式表示。
目标检测算法是当前图像处理和数字图像处理的流行方向。它广泛用于无人驾驶,工业监视,视频目标定位,航空航天和许多其他科学技术领域。使用图像处理算法来减少人力资本的使用具有重要的现实意义。因此,目标识别算法已成为近年来国内外技术理论和实际应用的研究重点。它是图像处理和计算机视觉学科的重要分支,也是智能监视系统的核心组件。目标检测也是泛身份识别领域的一种基本算法,在后续任务(例如面部检测,步态检测,人群计数和实例分割)中发挥重要作用。由于深度学习的广泛应用,目标识别算法得到了快速发展。
许多国际科技公司和研究机构,例如Google,麻省理工学院,Facebook和其他公司和大学的研究机构,都成立了用于实时对象检测的研究小组,并建立了用于实时对象监视的顶级实验室。近年来,欧美国家的许多科学研究成果已转化为实际产品,例如Google Glass,Google无人汽车等已陆续推向市场的产品。在中国,清华大学进行了远程身份认证相关的研究,中国科学院自动化研究所对交通和行人等多种智能检测设备进行了研究。中国的一些科技公司,例如百度,小米,海康威视等,在相关的视觉挑战比赛中也取得了不错的成绩。许多中国人与外国团队合作开发了良好的目标获取算法。
(二)研究主要成果
目标发现任务分为两个主要的子任务:目标分类和目标定位。首先,目标分类任务确定输入图像或图像区域中是否存在感兴趣的物体类别,并生成一系列打分标签,这些标记指示感兴趣的图像将出现在输入图像或图像区域中的可能性并显示。目标定位任务则负责确定目标对象在输入图像或图像区域中的位置和范围,显示对象的中心或对象的闭合边界。通常,矩形边界框是显示对象位置范围的最常见选择。目前,国内外主流的目标检测算法主要基于深度学习模型和在深度学习模型上的改进而分为两大类。一种是单阶段(One-Stage)检测算法,该算法无需区域建议阶段即可直接生成对象。常见算法(例如YOLO,SSD和CornerNet)的类概率和位置坐标。另一种是两步目标(Two-Stage)检测算法,该算法将检测问题分为两步,首先生成候选区域(region proposals),然后对候选区域进行分类和缩小范围:这种算法的典型代表,有基于region proposals(例如R-CNN,Fast R-CNN和Faster R-CNN)的R-CNN系列算法等。
目标检测模型的关键性能指标是检测的准确性和速度。为了提高准确性,目标位置检测必须考虑对象定位和分类的准确性。通常,两阶段(Two-Stage)算法在准确性方面具有优势,而一阶段(One-Stage)算法在速度方面具有优势。然而,技术研究的进步使得两种方式都得到了改进,两种算法在准确性和速度上都有了更好的结果。
纵观Yolo算法(You Only Look One),基于深度学习的实时目标检测算法正变得越来越流行,用于研究和应用程序的实时目标检测算法,例如智能交通,智能监控,安全,军事和外科医学。你可以看到该领域具有广泛的用途。人脸检测在人机交互,智能安全和犯罪检测领域具有重要的应用前景。随着深度学习的到来,人脸检测技术使用了卷积神经网络,从而获得了强大的特征提取能力。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。