- 文献综述(或调研报告):
手写汉字识别(HCCR)由于类别集较大、书写风格多变、以及类似字符之间的混淆而很难实现。它从20世纪80年代开始受到很大的关注,并出现了许多有效的方法。一些重要的技术,都为今天的手写字符的高精度识别做出了贡献。
至今,汉字识别的过程主体步骤基本确定,一般只在部分具体步骤上更新技术,不断改进。识别流程如下:
手写汉字识别可以分为即时书写识别与书法作品识别。前者相对较简单,主要依据平板电脑和白板等信息采集设备记录书写者书写顺序与轨迹还原判断书法内容,但当书写者笔画顺序错置等意外情况时,所得结果的准确率将会大大降低[6]。
对书法作品的识别流程往往固定,一般只是在特征提取与识别分类时采用不同的技术。
汉字特征主要包括统计特征和结构特征,统计特征提取的包括局部特征提取和全局特征提取,局部特征提取如蜂窝特征、Polyoonal近似和曲线近似等方法,往往是相对忽略汉字的整体结构,在局部特征的范畴内,发现像素本身,即所谓的“细胞特征”,以及组分边界的多边形近似。顾名思义,像素特征仅使用原始像素数据作为特征向量。细胞特征用局部变换的结果替换图像中的每个像素或像素组。细胞特征类还包括由感受野神经网络提取的特征。多边形近似包括将一系列线段拟合到表示输入的连通区域的外部,并使用此线段列表作为特征向量。结构特征提取主要有基于轮廓的特征和基于骨架的特征[2]。
而在手写汉字识别方法上,修正二次判别函数(MQDF)、判别学习二次判别函数(DLQDF)[1]、高性能卷积神经网络(CNN)[5]等方法都取得了很大的进展。
Meijun He等人的论文显示他们对基于卷积神经网络(CNN)的手写汉字识别置信度进行了全面分析。他们得出基于CNN的置信度测量是一种有效的方法,可以知道识别结果的可靠性,那意味着CNN可以产生正确识别结果的高概率,而对于手写汉字识别,可以高可信度地识别超过92%的字符。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。