深度学习的手写字符串识别研究(源码)

为了实现对手写字符串的识别,本研究选用MNIST手写数字数据集和Chars 74k手写数字英文数据集,采用深度学习的方法进行数字和字母字符串的识别。首先,对采集的手写字符串进行预处理,利用垂直投影法将字符串分割。其次,针对不同算法构建出不同的识别模型。建立SAE、DBN、CNN网络模型,分别对三种模型进行训练和测试。接着,针对单个模型,对学习率、样本数量、迭代次数等参数进行调整,得到针对该数据集的最适模型。其中CNN识别效果最好,在此基础上对CNN进行优化,在MNIST手写集上运行时间缩短了83.8%,识别率提高了8.2%,达到98.2%。最后,设计系统界面,实现了对输入的手写字符串图片的识别。
目录
摘要 1
关键词 1
Abstract 1
Key words 1
引言 1
1 绪论 2
1.1 研究背景及意义 2
1.2 国内外研究现状 2
1.2.1 国外研究现状 2
1.2.2 国内研究现状 3
1.3 研究的主要内容 3
2 开发工具 4
3 数据集建立与预处理 5
4 基于深度学习的手写字符串识别 7
4.1 基于SAE的手写字符串识别 7
4.1.1 稀疏自编码器(SAE)算法原理 7
4.1.2 算法流程 8
4.1.3 实验结果 9
4.2 基于DBN的手写字符串识别 10
4.2.1 深信度网络(DBN)算法原理 10
4.2.2 算法流程 11
4.2.3 实验结果 12
4.3 基于CNN的手写字符串识别 14
4.3.1 卷积神经网络(CNN)算法原理 14
4.3.2 算法流程 14
4.3.3 实验结果 15
4.4 算法比较 17
4.5 CNN优化 18
4.5.1 激活函数 18
4.5.2 卷积层 18
5 系统实现与分析 21
6 总结与展望 24
致谢 25 *好棒文|www.hbsrm.com +Q: ^351916072* 

参考文献 25
基于深度学习的手写字符串识别研究
引言
引言
1 绪论
研究背景及意义
对手写字符串进行自动识别是当前人工智能领域的研究方向之一,在计算机技术蓬勃发展的时代大背景下,在银行票据、办公、财务报表、邮政编码、计算机辅助教学等方面都有相关应用产品,具有很大的研究价值。
识别手写数字字符串作为光学字符识别OCR技术的重要研究部分,根据识别过程分类,分为脱机和联机,其中尤以对脱机手写字符串的识别最艰难。根据字符的类别分析,只有62种,结构简单,但是仍然难以应用到生活中。主要原因有:第一,手写字符相似体多。在62个字符中,有一些字符,比如1与7、i与l等,字形十分接近,使机器不能轻易分辨出它们;第二,手写字符形式多样。手写字符的书写因人而异,致使相同的手写体可能会有不同的变形,这也决定了在手写字符识别中单一的识别算法是不存在的;第三,手写字符所要求的识别率高,必须具备高正确率和低误识率。
虽然研究者们对脱机手写字符的识别方法的研究已经有很长时间,也获得了卓越的成就,但是,机器目前的识别能力仍不能与人类的相提并论,依然是一个难以攻克的关口。
对手写字符串进行自动识别是当前人工智能领域的研究方向之一,人们对其已经有很长时间的研究,近几年来取得了巨大的进展。国外已经研制出了Transcribe等产品应用于联机手写识别,但是在脱机手写识别方面,研究成果还非常少。随着科技的进步和人民对于物质文化的要求日益增长,对于计算机处理手写字符串的要求也越来越多,因此,人们渴望一种高效实用的手写识别方法。
识别脱机手写字符串不仅具备了实用价值,而且具备了较高的理论价值。因为识别手写字符串的研究方法能够推广到其它问题上,比如汉语词语等,因此它逐渐成为科技发展的焦点之一。
国内外研究现状
国外研究现状
欧美国家早在1920年就开始了对光学字符识别技术的研究。在上个世纪三十年代,陶舍克通过光学模板匹配法对于数字进行研究。1958年Crimsalde等人是首批提出用计算机的方法识别字符的研究者们,利用扫描器扫描输入[1],比较结果与计算机内部模式的不同,评测识别效果。
1960年,来自麻省理工学院的Eden提出一种思想,一切拉丁字符都由18种笔划形成,而这又可分解成4个简单的笔划[1],在之后的研究中采纳句法模式的方法进行识别的理论依据都是这一思想。
1970年,Parks等为了提取特征,尝试了一种抽取拓扑特征的方法,并且利用多级结构链接的方法进行识别。不久,日本对印刷体汉字,在线手写汉字识别以及手写印刷体汉字进行了讨论,在二十世纪八十年代进行了针对印刷体汉字的识别展示[2]。
1980年初,随着计算机的广泛应用,字符识别技术发展迅速。许多科研工作者们把其它领域的ANN、分形、模糊理论、小波变换等新兴技术及研究方法[2]应用到光学字符识别技术的研究中,并且获得了卓越的成就。
到了1990年,Vapnik等人在有限数量样本的机器学习问题上取得了很大的突破,提出了支持向量机的概念[3]。支持向量机的出现为识别手写字符的研究带来了新的方法和思路,并且在模式识别等领域得到充分地应用。
近年来,越来越多的研究者们在手写字符的识别中应用CNN神经网络。在2013 年,来自英国华威大学的Graham在ICDAR 手写汉字比赛中[4]利用深度稀疏卷积神经网络获得了联机手写汉字识别第一名,识别率达到97.39%[5]。同时,富士通公司团队提出了一种改进的卷积神经网络对脱机手写汉字进行识别,准确率达到94.77%[4],获得了冠军。
国内研究现状

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/1654.html

好棒文