图像处理的手写体字符识别

摘 要OCR光学字符识别(Optical Character Recognition),是一种通过光学扫描来实现对书面文字的识别,并转换为计算机文字的技术。脱机手写体字符识别是其中重要的研究热点之一,它在电脑阅卷、包裹分类、银行支票识别、文档扫描以及统计报表处理等各个方面都有所涉及,对手写体字符的识别有着重要的理论探讨意义和实际运用价值。本文对脱机手写体字符识别系统的设计与实现展开了具体的研究,主要的工作内容如下:本文系统讲解了OCR技术的历史发展背景与研究现状,以及人工神经网络的原理与构造,采集了0-9十种数字、a-z和A-Z字母各1000张不同写法的手写体图片,建立了脱机样本库,并选择用BP神经网络进行训练。与此同时对包含单个或多行多个手写体字符的图片利用MATLAB进行预处理,进行读取、定位、灰度处理、二值化处理,再利用改进的连通域算法进行切割、归一化处理、倾斜校正和紧缩重排、平滑和去噪以及细化处理。最终利用已经训练好的神经网络进行识别,并输出识别结果。整个系统设计流程符合科学研究规范,经测试,该系统运行正常,响应快捷,操作简单,字符识别正确率较高,证明了采用BP神经网络来进行手写体字符识别的研究方案的合理性,也体现了该系统具有较高的实用价值。
目 录
摘 要 II
ABSTRACT III
目 录 IV
第1章 绪论 1
1.1 手写体字符识别问题的提出 1
1.2 手写体字符识别的研究背景和研究意义 1
1.3 手写字符识别的发展过程和研究现状 2
1.3.1 手写体字符识别的发展过程 2
1.3.2 手写体字符识别的研究现状 3
1.4 手写体字符识别的研究存在的问题 4
1.5 论文主要研究内容及安排 5
第2章 手写体字符图像预处理过程 7
2.1 图像输入模块 7
2.2 灰度转化 8
2.3 二值化 9
2.4 去除噪声和降噪处理 11
2.5 整体倾斜度调整 12
2.6 字符分割 13
2.6.1 边缘检测法 13
2.6.2 直线提取法 13<
 *好棒文|www.hbsrm.com +Q: 3 5 1 9 1 6 0 7 2 
br /> 2.6.3 阈值分割法 14
2.6.4 投影法 14
2.6.5 连通域算法 15
2.7 字符归一化 19
2.8 字符的紧缩重排 20
2.9 特征提取 20
2.9.1 骨架特征提取法 20
2.9.2 逐像素特征提取法 21
2.9.3 垂直方向数据统计法 22
2.9.4 13特征点提取法 22
第3章 几种常用的人工神经网络简介 23
3.1 神经网络概述 23
3.1.1 人工神经网络概述 23
3.1.2 人工神经网络的发展简史 23
3.1.3 人工神经网络的特性 24
3.2 人工神经网络的原理 24
3.2.1 人工神经元的基础模型 24
3.2.2 人工神经网络的基本结构 25
3.2.3 人工神经网络的学习 27
3.2.4 人工神经网络的学习规则 28
3.3 各种人工神经网络的优劣比较 29
3.3.1 感知器神经网络 29
3.3.2 线性神经网络 29
3.3.3 反馈神经网络 30
3.3.4 BP神经网络 31
第4章 手写体字符识别系统中BP神经网络的设计与实现 32
4.1 BP神经网络概述 32
4.2 系统详细设计 32
4.2.1 整个系统流程的文字解释 33
4.2.2 BP神经网络的学习过程 33
4.2.3 BP神经网络各层神经元数量的确定 34
4.2.4 BP神经网络参数的确定 37
4.2.5 BP神经网络的学习规则 37
4.2.6 BP神经网络的局限性 37
4.2.7 BP神经网络的改进 38
4.3 系统实际测试效果 38
4.4 本系统运行中出现的问题和解决方法 40
第5章 总结与展望 42
参考文献 43
致 谢 44
附 录 45
附录1 文献翻译 45
附录2 系统部分源程序 66
第1章 绪论
本章主要介绍了本研究课题的提出,手写体字符识别研究的背景与理论价值,其研究的发展历史,目前国内外的研究情况,以及当前研究存在的困难等,并阐述了论文的主要章节安排。
1.1 手写体字符识别问题的提出
纵观人类文明发展史,从学会使用工具到创造系统的语言,从蒸汽机车的发明到电灯的使用,从计算机的诞生到人工智能的飞速发展,我们一直都在努力用科技力量来减少自己的劳动并且获得更高的工作效率和更多的工作成果。随着计算机图形学和机器学习的飞速发展,在信息爆炸的时代背景下,人们对机器智能辅助处理信息的要求也越来越迫切,这就催生了模式识别这门科学。
模式识别是一门于上世纪六十年代初期快速发展起来的研究学科[1],主要研究如何通过计算机来对研究对象进行信息自动化处理。由于它的研究方向具有巨大的发展前景,将会对人工智能乃至整个人类社会产生深远影响,因而受到了很多领域的科研人员的注意。截止目前,模式识别主要被应用在文字、指纹和语音识别、遥感控制、医学诊断等方面,而文字识别又是其中的重要研究部分[2]。
文字识别在许多环境中都有着十分广泛和具体的应用。上世纪50年代开始,人们广泛探讨一般文字的识别算法,并在接下来的几十年之间研制出了各种能投入到生产中的实际应用或机器。文字识别一般的研究流程包括信息收集、信息分析与处理和相关分类及识别等几个部分,而它可以分为两大类:印刷体和手写体字符,根据输入设备的不同,每一类又可分为联机字符识别和脱机字符识别[3]。脱机字符识别又称为光学字符识别,即OCR.联机手写体字符识别由于有可以追踪的输入轨迹,一般来说比较简单,而脱机手写体字符识别相对来说比较困难。脱机手写体字符识别在生活中有许多重要应用,如统计报表、考试自动化阅卷、邮政编码识别分类、包裹分拣、银行支票识别等方面,又由于每个人书写方式和习惯的不同,所以脱机手写体字符识别成为了目前研究的热点与难点,本文也将着力探讨和研究这一课题。
1.2 手写体字符识别的研究背景和研究意义
距第三次产业技术革命过去已经半个多世纪了,人类早已进入数字化信息时代,我们每天都要面对无数的数字、字母、符号和汉字,如果全靠人工来处理,那么工作效率就会非常的低,同时对人力物力的消耗也是巨大的。这就要求计算机能够帮助人们精确完成字符识别的相关工作,将人们从繁重的工作中解放出来。所以,不论从理论上还是实际应用上来说,手写字符识别有着极为广泛的研究意义和发展前景。主要表现在以下几个方面:
1.每个人在书写中可能出现连笔、大小不一、粗细及力度不同等各种情况,这就加大了手写体字符识别中对字符分割问题的难度。但从另一个角度讲,如果这些问题我们都能够很完美的解决,那么对汉字乃至各国文字的手写体识别与研究以及人类在人工智能方面的探索都将带来极大的便利和经验基础
2.我国每十年就要进行一次全国人口普查,以前完全要靠手工输入并保存数据,需要耗费大量的人力和物力资源[4]。近年在类似的大规模数据统计工作中,采用OCR技术已成为一种必然的选择,极大地减少了统计过程中所需要耗费的各类资源,也提高了统计的效率和准确度,对我国各类政策的制定都有着重要的影响。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jxgc/zdh/3046.html

好棒文