神经网络的银行票据号码识别系统

摘 要近年来,银行逐步上线票据影像系统,正式揭开我国票据处理可视化、流程化、数字化的序幕。长期以来,人工处理票据的模式,不仅耗费大量的人力与时间,而且不利于银行效率的提高。因此,实现票据的自助化办理,已成为一种必然的趋势。论文介绍了一款银行票据号码识别系统,该系统由三大模块组成:图像预处理模块、号码定位与分割模块以及基于神经网络的识别模块。在图像预处理中,研究了灰度变化、区域粗定位、图像二值化、去噪等预处理过程。在号码定位分割中,根据票面特征设计了基于投影直方图的精确定位算法,根据区域生长法对单个号码进行分割,并对结果进行归一化处理。在号码识别模块中,设计了基于BP神经网络的识别算法,提取了粗网格特征作为输入特征,并针对识别结果进行了分析。在MATLAB平台上进行的仿真实验结果表明,总体识别率达到98.9%,系统性能较好。
Key words: image preprocessing; character segmentation; BP neural network; number recognition 目 录
摘 要 I
ABSTRACT II
第1章 绪论 1
1.1 课题研究的背景及意义 1
1.2 国内外研究现状 1
1.2.1 国外的研究水平 1
1.2.2 国内的研究现状 2
1.3 本文主要技术及系统框架 3
1.3.1 数字图像处理技术 3
1.3.2 字符识别的方法 4
1.3.3 系统框架 4
1.4 论文内容及结构安排 5
第2章 银行票据号码识别中的图像预处理 7
2.1 银行票据的图像特征 7
2.2 RGB彩色图像的灰度化 8
2.3 号码区域的粗定位 9
2.4 图像的二值化 10
2.4.1 图像二值化介绍 10
2.4.2 全局阈值法 10
2.4.3 局部阈值法 11
2.4.4 二值化图像 11
2.5 离散噪声的去除 12
2.5.1 图像噪声介绍 12
2.5.2 图像噪声
 *好棒文|www.hbsrm.com +Q: *351916072* 
模型 13
2.5.3 图像平滑去噪 14
第3章 数字号码的定位与分割 17
3.1 字符区域的精确定位 17
3.2 单行数字号码的分割 19
3.2.1 模板法检测字符间断 19
3.2.2 区域生长法 22
3.2.3 字符的分割 22
3.3 字符的归一化处理 25
第4章 基于BP神经网络的号码识别 26
4.1 人工神经网络的概述 26
4.1.1 神经元模型 26
4.1.2 神经网络模型 27
4.1.3 神经网络的网络结构 30
4.3 BP神经网络的设计 31
4.3.1 输入层和输出层的设计 31
4.3.2 隐藏层结构设计 31
4.3.3 输入特征 32
4.3.4 节点设计 33
4.4 BP神经网络的训练 33
4.4.1 训练样本的选取 34
4.4.2 训练的停止条件 34
4.4.3训练过程 35
4.5 基于BP神经网络的数字号码识别 35
4.6 识别结果分析 36
4.7 GUI界面展示 37
第5章 总结与展望 39
5.1 工作总结 39
5.2 今后工作的展望 39
参考文献 41
致谢 43
附录1:英文文献 44
附录2:中文翻译 60
第1章 绪论
1.1 课题研究的背景及意义
我国的银行有很多的传统资产业务,而票据业务就是其中之一。银行的票据业务很大部分是用在商业上的,是银行信用和商业信用的结合。所以开办票据业务,让市场经济下的商业信用票据化,能够促进商品的生产和流通,为经济建设创造条件[1]。
在以前,票据的验印、审票和记账都是采用的人工模式,但是近年来,随着银行票据业务的不断扩大,传统的处理模式,不仅会耗费大量的人力和物力,而且效率低下。因此为了提高银行工作的效率,我国银行票据的处理模式必须进行改革。
随着计算机视觉技术的发展,人民银行政策的导向,实现票据自助化办理已经从政策、技术等方面具备了条件。本课题利用数字图像处理技术和神经网络识别技术,对各类票据号码进行识别,用来代替人工的处理方式,这对提供高效安全票据处理模式,提高银行工作效率有重大的意义。
本课题依托“河海大学——江苏国光信息产业股份有限公司工程实践教育中心”(国家级实践教育中心),河海大学与江苏国光合作承担的智能视觉物联网关键技术课题研究。
1.2 国内外研究现状
从当今的业内行情来看,号码自动化检测技术方面的相关研究情况十分火热,国外的很多机构在此方面投入了大量的人力物力并且取得了大量收获,在如今的市场上已经可以看到不少由此衍生的周边产品,这些产品被广泛使用并带来了相当可观的收益。反观我国国内,由于种种原因的限制,研究水平与国际领先水平仍然存在着很大的差距,能够应用到实际市场中的理论成果也是比较少的。
1.2.1 国外的研究水平
OCR的概念最开始面世是在1929年,由当时的一位德国科学家提出。刚开始的时候,人们进行字符识别主要是采用模板匹配的方式,这种方式需要建立庞大的模板库,而且不同种类字符的识别需要不同的模板库。后来为了改善字符识别的方式,美国科学家Handel提出,可以采用一些技术的手段,对图像文字进行识别处理,从而避免建立庞大的模板库。后来经过差不多一个世纪的发展,OCR的技术才有了很大的突破,在实际生活中得到了广泛应用。例如智慧交通系统中的车牌识别、移动设备上的图像文字录入以及本文研究的银行票据号码识别等。
美国的创视公司开发的视觉监控系统,可以实现在线读取字符信息并且进行识别,不仅识别率高达100%,而且识别速度可以达到300m/min。该系统还可以实现监控功能,对出现问题的监测目标进行记录和保存。该系统功能强大,但是其操作简单,类似于Windows的操作界面,适合大范围推广,在票据识别以及数据库信息检测领域有很大的市场。而美国的威泰克信息在线检测系统能识别一维或者二维条码以及相应区域内所使用的字符,同时还可检测空白、条纹、污点等印刷质量的问题[2]。
总的来说,国外对印刷号码的自动识别检测的研究起步比较早,由于市场强大的需求,以及技术设备的支持,开发出了许多可以应用到相关领域中的识别检测系统。相较于国外,国内的研究还是比较落后的,尤其是很多技术只停留在理论阶段还未运用到实际。因此,考虑到我国的现状,有必要借鉴和学习国外的先进技术,提高我国票据等业务的处理效率。
1.2.2 国内的研究现状
目前,国内对票据检测的研究大都在开发阶段,而且现有的一些技术需要配备一些比较昂贵的设备,这就导致了开发出来的系统不能大范围的运用。得不到实际的运用,所开发出来的系统就不能改善,一定程度上也限制了票据自动化检测系统的发展。可喜的是,近年来,我国银行票据处理领域发生了大变革,为了提高银行效率,实现票据处理智能化,号码自动化检测系统的开发迫在眉睫。有了政策和市场的号召,大量的研究人员投入到了票据检测系统的开发,这使得国内的研究现状有了很大的改善。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/txgc/1115.html

好棒文