联机手写识别软件的设计

摘 要计算机的普及给人们的生活带来了便利,但是对于部分人而言,键盘输入十分困难,需要手写识别来帮助。手写识别技术的研究从上世纪就已经开始,随着经济和科技的发展,手写识别技术在我们生活中发挥着越来越重要的作用。本文主要研究内容是手写数字的识别,具体工作如下:首先需要对手写的数字进行灰度处理、图像分割等预处理,然后将图片转换为0、1表示的矩阵,经过处理的图像进行通过BP神经网络进行分类识别。经过同样预处理的手写数字也可以通过基于最小错误率或者基于最小风险的贝叶斯分类器进行识别。经过本文验证,BP神经网络和贝叶斯分类器在手写数字识别的应用上都几乎可以达到将近100%,但是同样可以从实验结果可以看出,在一些手写数字并不清晰的情况下,识别还是存在误判的情况。这表明手写识别的精度尚需要进一步提高。
目 录
摘 要 II
ABSTRACT III
目 录 IV
第一章 绪论 1
1.1 课题研究的背景及意义 1
1.2 联机手写识别技术在国内外研究的现状 2
1.3 本文研究主要内容 3
第二章 BP神经网络基本介绍 4
2.1 BP神经网络基本原理 4
2.2 BP神经网络的基本算法 6
2.3 BP神经网络的计算方法 7
2.4 BP算法的流程图 8
第三章 基于BP神经网络的手写数字识别 10
3.1 基于BP神经网络的样本处理 10
3.2 基于BP神经网络的结构设计 12
3.3 系统的参数选择 15
3.4 最终实现效果分析 17
3.5 BP神经网络的改进 19
3.6 本章小结 20
第四章 基于贝叶斯分类器的手写数字识别 21
4.1 贝叶斯定理 21
4.2 基于贝叶斯分类器的手写数字识别 21
4.2.1 最小错误率贝叶斯分类器的手写识别 22
4.2.2 最小风险贝叶斯分类器的手写识别 24
4.3 本章小结 25
第五章 总结和展望 26

 *好棒文|www.hbsrm.com +Q: ^3^5`1^9`1^6^0`7^2# 
5.1 总结 26
5.2 改进与展望 27
5.2.1 改进 27
5.2.2 展望 28
致 谢 29
参考文献 30
附录 34
第一章 绪论
自进入21世纪以来,科学技术则的发展可谓日新月异,人们希望科技能够带来更多的便利,因为键盘输入也已经没有办法满足现状,所以出现了手写识别技术。手写识别一般说来,根据操作状态可以分作两种,一种是脱机手写识别,另一种,则是联机手写识别。从识别对象来说可以分为两大类,一类是文字信息,如各国家各民族的文字,英语,汉语等,另外一类则为数字信息,主要是阿拉伯数字组合的数据信息,主要应用于收据、发票等。经过几十年各国人民的共同努力,已经研发出一系列可以实现手写输入的设备。这些设备的诞生,提高了我国的计算机普及率和信息交流速度,同时也大大改善了人机交互体验。
课题研究的背景及意义
计算机的普及使其变成日常生活不可或缺的一部分,然而现代社会各民族各地区接受教育程度有极大不同。一方面是计算机使用的重要性,另一方面则是由于教育程度或者是年龄问题学习键盘输入困难的人群,两方面相互交织,促进了联机手输入识别的诞生,并必须要求其能够达到一定精度以适应大众生活。
现在技术的情况下,计算机输入的方法有以下两种:
1.人工键盘输入法(普遍使用);
2.机器自动识别输入法。
人工键盘输入法早已达到一定的发展水平,其工作原理是将字符进行编码,再通过键盘进行输入。正是因为它的起步比较早,所以到了现在技术已经成熟,就汉字一种,就有例如五笔输入法、拼音输入法等多种方法。机器识别法则摒弃了编码这种相对来说大脑负担比较重的方法,而是直接将字符转换成为计算机可识别的信号,由计算机再进行处理。根据计算机接收信号的不同,机器自动识别输入法也可以分为两种:
1.语音机器识别输入法;
2.图像机器识别输入法(手写识别)。
语音识别现今已经达到了较高水平,尤其是在社交软件加入语音通信以后,语音识别推广越来越快,其精度要求越来越高。但是由于不同的人有不同的口音以及同音字同音词的存在,加强了语音识别的难度,虽然技术已经很完善,但是识别很大程度上依靠上下文的贯通理解。语音识别仍具有较大的发展空间和前景,本文不做赘述。
图像机器识别输入法具有很强的推广价值,它不需要操作者记忆相应编码,操作难度小,门槛低,适合广大普通人使用。目前图像机器识别输入法已经有了 相当的发展,其中有单一或者是多种印刷体识别和联机手写识别等。脱机手写识别的工作方法实际上是通过光电转换设备将印刷体扫描输入计算机成为电信号,可以解决联机手写输入慢的问题。
联机手写虽然输入速度较低,但是有很强的实时性和可操作性。同时,联机手写对于一些有一定年纪或者说学习能力有限的人来说是一种接近计算机的极好方式,有利于计算机的普及也有利于丰富更多人的业余生活。
1.2 联机手写识别技术在国内外研究的现状
字符自动识别在国外起步较早,早在上世纪20年代就已经开始,德国人发明的“阅读机”算是最早的机器字符识别系统,还获得了德国专利。当然,由于当时时代的限制,该“阅读机”在现在看来也是十分笨拙。印刷体数字OCR产品于20世纪50年代手写板的出现让联机手写识别的发展走上正轨。1955年开始出现,此后转向手写英文和数字的识别。1966年的时候IBM发表了第一篇关于汉字识别的文章,这篇文章讲述了用模板匹配法识别1000个印刷体汉字,从此以后汉字的识别进入了被研究的科技舞台。此后,IBM推出了一套较为成熟的联机手写汉字识别饿系统,该系统中含有72个字根,42个笔画。由该系统识别900多汉字以后,准确率高达91.1%;识别2000多个汉字时,仍然能够保持70%以上的识别率,这在当时实属先进。然而我国并没有就此开始了研究汉字手写识别,反而是日本在这方面作出了巨大贡献。我们国家开始在这个方向上研究,还是从上世纪80年代开始的。经历了这几十年,现阶段对手写汉字识别的研究还在继续的除了日常生活中需要大量使用的国家,中国和日本以外还有美国和加拿大,这几个国家当中日本的水平算是比较高。
国内联机手写汉字识别起步较晚和我国计算机在国内普及起步晚有着莫大的关系。但是我国在政策上十分重视其发展,先后把它列入了“七五”“八五”等重大项目中。国家政策上的支持给手写汉字识别技术在我国的发展提供了足够的动力和空间,因此我国在后来的时候在汉字识别上也有很大的进展。
本文研究主要内容
本文主要做的是联机手写识别软件的设计。主要运用到了BP神经网络和贝叶斯分类器两种方法。第一章的内容是对本课题研究背景意义和国内外现状的一个总结介绍。第二章主要介绍了基于BP神经网络的系统的设计,介绍了BP神经网络的原理和它的一些计算方法。第三章主要是在第二章的基础上做了系统的设计。第四章 介绍了贝叶斯定理和在这个定理上面衍生出来的贝叶斯分类器。基于贝叶斯分类器的两种统计方法,也就是最小错误率和最小风险进行了联机手写程序的设计。然后本文第五章则是对这个这个课题的一些总结和展望,希望能够联机手写输入的识别能够不断发展,并获得更高的成就。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/txgc/1108.html

好棒文