印刷体数字识别系统设计

印刷体数字识别系统设计[20191214194221]
摘 要
随着信息化进程的快速发展,字符识别已运用到越来越多的领域。本文以银行支票流水号识别为背景,设计出了基于BP神经网络的印刷体数字识别系统设计方案。系统整体分为三个主要模块:图像的预处理、特征提取以及BP神经网络识别。
为了提升系统的性能,尽可能达到高的识别率,本文研究的重点和难点在这三个模块,分别设计过程,并提出了以下解决方案:
1.在图像预处理模块的设计,本文结合了多种图像处理技术,提出了灰度化、二值化、噪声去除、归一化这一系列的预处理,取得了良好的效果,为字符特征提取打下了坚实的基础。
2.字符的特征提取是系统设计的中心和难点,关系到整个设计方案的成败。本文对图像的宏观特征和微观特征分别进行了研究,在特征提取方面,提出了逐像素提取法、“13”折线提取法、垂直方向数据统计特征提取法和四方向特征提取法。
3.在BP神经网络识别的设计过程当中,本文参考了前辈的研究成果,仔细研究了包含网络结构设计、参数设计、网络训练和网络识别等关键性问题,给定了一组BP网络性能的优化设计方案。
经过研究我们可以知道,基于BP神经网络的印刷体数字识别系统不但能够高效地识别字符,而且还具有一定的抗干扰和形变的能力。
 查看完整论文请+Q: 351916072 
关键字:BP神经网络;印刷体数字;特征提取;字符识别;预处理
目 录
第1章 绪论 1
1.1数字识别背景及意义 1
1.1.1 数字识别系统的主要应用价值 1
1.1.2 数字识别系统的重要理论价值 1
1.2 数字识别现状及发展趋势 2
1.3 数字识别系统构成 3
1.4 本文主要内容及结构 3
第2章 图像的预处理 4
2.1 图像的灰度化 4
2.2 灰度图像的二值化 5
2.3 数字图像噪声去除 6
2.4 图像的归一化处理 6
第3章 图像数字的特征描述及提取 9
3.1 概述 9
3.2 宏观特征 9
3.2.1 粗网格特征 9
3.2.2 七段框架投影值特征 11
3.2.3 宽高比 11
3.3 微观特征 12
3.3.1 端点特征 12
3.3.2 穿线数特征 13
3.4 特征提取方法 13
3.4.1 逐像素特征提取法 14
3.4.2 垂直方向数据统计特征提取法 14
3.4.3 “13”特征点提取法 14
3.4.4 字符四方向特征 15
3.5 本章小结 16
第4章 BP神经网络识别 17
4.1 引言 17
4.2 多层BP神经网络的基本原理 18
4.3 BP网络的训练 19
4.3.1 训练样本的选取 19
4.3.2 误差准则函数 19
4.3.3 训练的停止条件 20
4.4 BP网络的识别过程 20
4.5 BP神经网络的算法 21
4.5.1 基本BP神经网络的算法 21
4.5.2 神经网络综合优化训练算法 22
4.6 小结 26
第5章 实验结果及总结 27
5.1 BP网络字符识别的设计实现 27
5.2 实验结果对比 27
5.3 总结及展望 31
致谢 33
参考文献 34
第1章 绪论
1.1数字识别背景及意义
1.1.1 数字识别系统的主要应用价值
(1)在数据统计中的应用
在工业、农业、人口普查等这些海量数据统计中,需要输入的数据量大,以往的手工输入,不仅费时,而且需要大量的人力和物力,效率低。现在的数字识别技术应用到这类工作已成为一种趋势。
(2)在金融相关领域中的应用
中国经济的快速发展,每一天都会越来越需要处理大量的财务、税务报表、支票等,这必定要涉及到大量数字运用,因此,数字识别有着越来越重要的作用。如果使用自动处理系统,以取代人工,可以节省大量的人力、物力、劳动力。与上面提到的统计报表处理相比,在金融领域的实现更加困难,因为以下三个方面:一是要求愈来愈高的识别精度;二是在处理过程中经常涉及到多种表格,需要同时处理,因此要求一个系统能够同时有效处理不同表格;三是处理日常工作中手写的字符应尽量按照一般习惯,这明显又对识别及预处理中心算法提高了要求。
(3)数字识别在车牌字符识别中的应用
数字识别和车牌字符识别有很多共同点,车牌字符识别的数字字符直接应用于车牌字符识别,可以资源共享,也可以被用在公共车辆监控系统,帮助快速找回失窃以及交通肇事逃逸车辆。
(4)在分拣邮件中的应用
随着生活水平的不断提高和技术的迅速发展,使通信需求的信函互换量大幅增加,我国函件业务量也在不断增加,一些大城市中心的邮局每日处理的邮件、快递量可以是数以百万计的,业务量的迅速增长使邮件自动分拣非常重要。在邮件自动分拣中,数字识别通常和光学条码识别、人工辅助识别等技术一起使用。
1.1.2 数字识别系统的重要理论价值
(1)阿拉伯数字作为被世界各国通用的独一符号,对数字识别的研究也就基本上与各地文化背景无关,为各国、各地区的研究者提供了一个发挥才智的平等的大舞台。
(2)因为数字识别的种类数不大,有利于我们做深入研究以及考证该领域一些外延理论。比如人工神经网络(ANN),其中相当一部分的ANN模子和算法都以数字识别作为实验平台,验证理论的有效性,评估各类方法的优势与不足。
(3)尽管人们对数字识别的研究历时已久,并取得了显著的成果,但现今机器的识别能力还无法与人的认识能力及判断能力相企及,因此,高精度的数字识别研究仍然是一个有待进一步研究的高难度问题。
(4)数字的识别方法研究能进一步拓展到很多相关问题的研究中,并对一些相关问题具有重要的指导作用,比如利用26个英文字母扩展成拼音文字的识别就是很好的例子。
1.2 数字识别现状及发展趋势
数字识别在学科范畴上属于人工智能和模式识别。在过去的几十年中,人们研究出了许多种方法来获取字符的关键特征,分为结构分析和全局分析。对于结构分析,一般我们会从字符轮廓或骨架上提取表现字符形状的基本特征,如圈、端点、节点、突起、凹陷、笔画等。从全局分析,我们可以采用模板匹配、像素密度、特征点等技术。分类法在大多数情况下跟此类构成特征结合运用。经过长期的实践研究我们了解到,对于有些完全自由的数字,可以相对肯定的得出这样的结论:目前还找不到任何方法能完全符合人们在实际应用中的识别理想状态。事实上,一些测试结果表明,印刷体汉字识别的精度一般高于数字识别,这其中主要原因是:
(1)数字形状差异小,使得一些数字很难区别;
(2)数字虽然只有10个,且笔画简单,但同一数字的写法却大有不同,其书写带有明显的区域特性,可以做到兼顾世界各类写法的极高识别率的通用性数字识别系统是很难实现的。
(3)实际运用中,由于数字并不与上下文关联,每一个单字的识别又都十分重要,并且数字识别常常涉及到财会、经济领域,其严格性显而易见,因此,对单个数字识别的准确率要求要比文字识别要求更高。
所以,用户的要求不仅仅是高正确率,更是极低的,甚至是低于万分之一的误识率。此外,大量的数据处理要求系统速度要达到一定速度,许多理论上完美但速度慢的方法是行不通的。所以,研究出高性能的识别算法是十分有难度的。
1.3 数字识别系统构成
数字图像识别系统包括数字图像分割和数字图像识别。字符分割就是使图像由一系列的物理意义的连通区域表示。它所要完成的工作主要是把每个字符从多行或多个字符的整个图像中分割成为单个字符。传统的字符分割算法可分为三种:直接分割法、基于识别基础上的分割法和自适应分割线聚法。
直接分割法最常用,具体算法如下:
第一步,从下到上对图像进行逐行扫描,碰到第一个黑色的像素点就记录下来。然后从上到下对图像逐行扫描,直到第一个黑色像素,用这种方法找到图像大致的高度范围。
第二步,在这个高度范围内,把在从左开始逐列扫描遇到的第一个黑色像素作为字符分割的起始位置,然后继续扫描,直到有一列中没有黑色像素,则这个字符分割结束,然后继续扫描,依照此方式一直扫描直到图像最右侧,从而获得每个字符的较精准的宽度范围。
第三步,在已知的宽度范围内,按照第一步的方式分别进行从上至下和从下到上的逐行扫描,从而得到每个字符精准的高度范围。
数字图像识别流程图如图1.1所示:
图1.1 数字图像识别流程图
1.4 本文主要内容及结构
本文共分五章,第1章是绪论,介绍了选题的背景和意义、发展、数字识别系统组成等相关内容。第2章对图像进行了灰度化、二值化、噪声去除以及归一化处理,并对实验结果进行了分析。第3章介绍了数字图像特征以及为其特征提取重点介绍了逐像素特征提取法、13点特征提取法等数字字符的特征提取方法。第4章介绍了BP神经网络识别。第5章分析和讨论了实验数据。
第2章 图像的预处理
2.1 图像的灰度化
图像的调色板内容通常都比较繁杂,这就使得图像处理的很多算法没办法展开,因此我们要对它进行灰度处理,它是图像处理中非常关键的一步,其结果更是后续处理的基础。灰度化处理就是将彩色图像转化成灰度图像的过程。由于彩色图像每个像素的R、G、B值不相同,因此就显示出了红绿蓝等不同的颜色。灰度化就是使彩色图像的RGB分量相等的过程,当R、G、B分量相等时,图像的颜色变为黑白色,只有亮度发生变化,并没有颜色改变。在RGB颜色模型中,称R=G=B的值为灰度值。灰度值越大像素点就越亮(对于256色图像,像素值最大为255,为白色),相反就越暗(黑色像素值最小,为0)。
R、G、B的取值范围为0-255,因此灰度的级别为256级,也就是说,灰度图像仅能表现256种颜色(灰度)。
图像灰度化的算法有多种,下面介绍3种常用算法:
1.最大值法:令R、G、B的值等于三者中最大的一个,即
(2.1)
该方法可以产生高亮度值的灰度图像。
2.平均值法:令R、G、B的值等于三者的平均值,即:
(2.2)
该方法可以产生较柔和的灰度图像。
3.加权平均值法:依据重要性或其他指标赋予R、G、B不同的权值,并令R、G、B等于三者的加权平均,即:
(2.3)
其中, 、 、 分别为R、G、B的权值。 、 、 取不同值,加权平均值法可以产生不同的灰度图像。由于人眼对绿色最敏感,红色次之,对蓝色的敏感度则最低,因此赋值使得 > > ,将生成较为理想的灰度图像。实验和理论推导可得,当 =0.30, =0.59, =0.11时,即:
(2.4)
时能得到最合理的灰度图像。
本设计用MATLAB软件下的灰度化函数rgb2gray对彩色图像进行灰度化处理。例如读入如图2.1所示图像,经灰度化处理就得到如图2.2所示的灰度图像。
图2.1 初始读入图像
图2.2 灰度处理图像
2.2 灰度图像的二值化
图像进行灰度化处理后,每个像素对应一个值,即像素的灰度值,灰度值大小决定了像素的明暗程度。为了更加方便地进行之后的图像处理操作,我们还需要对已经得到的灰度图像做二值化处理。
图像的二值化处理是大部分字符识别系统所必须的过程,二值化方法直接影响到字符识别系统的性能。图像的二值化就是把图像像素根据一定的标准转化成黑白两种颜色,图像中的字符用黑色表示,其余的为白色,这样就可将灰度图像转化为只含黑、白两种灰度的二值图像,为后续的处理提供了方便。但是图像二值化的过程会损失图像很多有用的信息,因此在这个过程中,保留住原图的主要特征十分重要。
较为普遍的二值化方法主要有固定阈值算法、全局阈值算法、局部阈值算法、自适应阈值算法等。
本设计采用的是固定阈值算法,设定阈值为0.5,采用二值化函数im2bw(x,0.5),若灰度级大于0.5,则转变为白色1,否则转变为黑色0。二值化执行后的结果如图2.3所示。
图2.3 二值化图像
2.3 数字图像噪声去除
在扫描或者传输过程中,图像可能会混入噪声,因此我们要进行去噪声处理,它是数字图像处理的重要环节。去噪效果的好坏将直接影响到之后的图像分割、边缘检测等图像处理工作。图像信号在产生和传输过程中都可能有噪声污染,一般数字图像系统中的噪声有:高斯噪声、椒盐噪声等。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/dzkxyjs/2514.html

好棒文