基于图像分割技术的支票图像版面分析
基于图像分割技术的支票图像版面分析[20191215145700]
摘要
随着图像处理技术和模式识别的不断发展,支票自动识别日益成为金融自动化的重要组成部分。而版面分析作为支票自动识别的前提条件,正随着支票版面的规范化和一体化,日益受到人们的重视。
支票版面分析系统的关键在于,确保版面中各功能单元进行高精度的分割,并得出其位置信息,为之后的版面识别做准备。因此在系统设计过程中,作者从实际工作出发,总结了当前数字图像分割领域的一些先进方法和思想,并以图像分割技术为基础,提出了一个完整的支票版面分析系统。该系统分为四大部分:预处理模块、倾斜校正模块、边界跟踪模块、区域提取模块。具体如下:
(1) 预处理模块研究了基于阈值分割技术的二值化、频域和空间域的平滑去噪;
(2) 倾斜校正模块研究了基于霍夫变换的直线校正方法;
(3) 边界跟踪模块主要是对支票图像边缘进行增强;
(4) 区域提取模块基于国内银行支票的特征,首先分析了金额区域和印章区域的提取,然后研究了基于连通域的区域提取方案。
通过分析比较程序运行结果,提出了一系列新颖的处理方法,如基于霍夫变换的倾斜校正、基于色度空间HSI的印章提取等,为支票版面分析提供了更加丰富的实现途径。
查看完整论文请+Q: 351916072
关键字:字版面分析、图像分割、版面识别、边界跟踪、霍夫变换、印章提取
Keyword:document analysis,image segmentation,layout recognition, boundary tracking, Hough transform, seal extraction目 录
第1章 绪论 1
1.1 引言 1
1.2 金融票据处理的基本概念 1
1.3 金融票据处理的发展现状 1
1.4 本文的研究内容及结构安排 2
第2章 图像分割与版面分析原理 4
2.1 数字图像分割技术的介绍 4
2.1.1 分割技术的分类 4
2.1.1.1 基于阈值的分割方法 5
2.1.1.2基于区域的分割方法 6
2.1.1.2.1 区域生长法 6
2.1.1.2.2分裂合并法 7
2.1.1.3基于边缘的分割方法 8
2.1.2 霍夫变换 9
2.2 票据版面的描述 10
2.2.1 票据组成 10
2.2.2 票据版面的基本定义 11
2.2.3 票据版面中各部分之间的关系 12
2.3 票据版面分析系统原型 13
2.4 票据版面学习 14
2.5 票据版面分析的难点 14
第3章 关键技术研究和试验 16
3.1 票据版面的数学模型 16
3.2 预处理 16
3.2.1 支票的二值化 16
3.2.2 图像平滑处理 17
3..3 支票倾斜校正 19
3.4 提取票据功能单元信息 21
3.4.1 票据类型特征的提取 22
3.4.2 票据功能单元提取方案 22
3.4.2.1 提取金额区 22
3.4.2.2 提取印章区 22
第4章 系统设计与测试 25
4.1 预处理 25
4.2 边界跟踪 26
4.2.1 前期准备 26
4.2.2 边界跟踪开始 27
4.3 区域提取 28
第5章 总结与展望 30
5.1. 总结 30
5.2 展望 30
参考文献 32
致谢 35
文献翻译 36
第1章 绪论
金融票据的版面分析是图象处理重要研究领域,也是票据识别的前提条件,因此是金融票据自动化处理系统的关键部分。随着模式识别的研究不断深入以及现实中日益增长的业务需求,票据版面分析与识别成为关注焦点。本章首先介绍金融票据自动处理的一些基本概念,然后陈述研究目的、意义以及发展现状.最后指出本文的主要研究内容以及篇章分布结构。
1. 1 引言
随着我国经济的迅猛发展以及全国票据交换系统的推广,金融票据的使用量出现了跨越式增长。随着经济全球化带来的行业竞争不断加剧,国内金融业对票据自动化处理的需求也在逐渐增大,而数字图像处理技术与模式识别技术的不断发展与支票一体化、规范化的趋势也给国内支票分析与识别带来了更广泛的应用前景。
1. 2 金融票据处理的基本概念
金融票据自动处理过程主要包括版面分析和版面识别两部分,其中:
版面分析[1](Document Analysis)是指分析给定的图象结构,提取出相互独立的图象要素并对其进行解释的过程。具体而言,系统需要分析待处理的票据图像的逻辑结构、辨识出其种类、从原始图像中定位并提取出相互独立的子图像、检测并去除票据中的表格框线,将填写的信息从背景和噪声中分离出来等一系列处理过程。这其中任何一步的错误都将可能影响支票最终的识别结果。
版面识别(Document Recognition)是指处理版面分析的结果,对版面内的图形、图象信息和要素之间的结构关系进行识别和理解、最终实现对填写域识别的过程。具体而言,是对填写域(如印刷体数字,手写体汉字、手写体数字以及印章)的识别。
我们可以将版面分析看成票据自动处理系统的前处理过程,将系统在版面分析之后的处理过程归为版面识别过程[2],二者相互作用、相互制约,在系统中具有同等地位。本文主要针对版面分析处理过程进行分析,研究其中的关键技术,并给出了相应的实现方案。
1. 3 金融票据处理的发展现状
随着计算机技术不断提升和广泛运用,金融领域大量重复的日常业务都逐渐实现了电子化、自动化、智能化,其信息管理的能力大大提高。尽管支票作为个人、单位团体等用来直接进行支付现金的工具,在国内已经实行多年,但在金融票据处理方面,多数银行仍停留在手工录入阶段,人工劳动强度较大,从而投入的人力物力较多,影响计算机系统发挥更大的效益,特别是事后监督业务,往往同样的数据需要重复输入。因此,票据自动分析和识别成为金融业务自动化的关键。
因为金融票据的版面都具有表格特征,所以表格的版面分析成为票据版面分析的重要任务。表格的版面分析[3]主要分为物理结构和逻辑结构[4]两个分析方面。其中,物理结构分析分为有先验知识分析和无先验知识分析两种。有先验知识分析即已知部分表格布局的情况下对表格中某项信息进行定位并提取,这样可保证版面分析的准确性和速度,但同时牺牲了效能。无先验知识分析即不需输入票据的特征信息和格式,通常借助支票左右角的基线和特征标志来识别支票类型。目前对这两种布局结构分析的研究都取得了一定进展,其中有先验知识的表格版面分析已成功在部分票据版面分析系统中应用。而由于中文表格的复杂性和多样性,使得无先验知识的表格版面分析仍有一定的难度。另外,逻辑结构识别的研究目前还非常有限。Watanabe等人曾提出采用一个二叉树从逻辑上来表示表格文件的布局结构[4]。还有,Douglas等人曾利用自然语言理解的方法对表格进行识别与理解。
中文版面分析与英文版面分析相比较而言,有其特有的困难:(1)汉字票据版面相对复杂,有许多独到之处。(2) 汉字是图形化的字符,笔画较多,结构复杂,在区分汉字版面中的文本与非文本部分上有一定的难度。尽管如此,我国中文版面分析的研究也取得了值得肯定的的成绩,如清华大学已经成功研制出了大型中文古籍《四库全书》自动版面分析系统[5]。
1. 4本文的研究内容及结构安排
本文提出了支票版面分析系统原型,对其中的关键技术做了一些深入讨论,并给出了部分实验结果。最后,作者对版面分析系统中部分模块提出了一些改进思路。
文章的具体分布结构如下:
第1章概述支票版面分析系统的背景以及本文的组织结构;
第2章介绍了数字图像分割技术和版面分析的原理;
第3章提出了一个完整的版面分析系统的原型,即包括倾斜校正、预处理、边界跟踪、区域提取四个模块,然后分别就各模块中的主要功能做了讨论,给出了具体可行的方案;
第4章展示了系统设计和程序运行结果;
第5章对本文进行总结,并进行展望。
第2章 图像分割与版面分析原理
本章第一节首先介绍了一些数字图像分割算法的基本概念,第二节提出了票据版面的数学模型,第三节介绍了支票本身的背景知识,第四节提出了完整的票据版面分析系统模型,第五节分析了票据版面学习,第六节介绍票据版面分析的难点。
2.1 数字图像分割技术的介绍
图像分割[6](Image Segmentation)是指把图像分成若干个特定的、具有独特性质的区域并提取出感兴趣目标的技术和过程。它通常是对图像进行分析、识别、压缩编码等处理的前提和重要组成部分,因此图像分割在理论研究和实际应用中都得到了人们的广泛重视。
图像经过分割处理后得到的子区域需要同时满足均匀性和连通性的条件,其中均匀性是指该区域中的所有像素点都满足基于灰度、纹理、彩色等特征的某种相似性准则;连通性是指在该区域内存在链接任意两点的路径。
2.1.1 分割技术的分类
根据分割方法的不同,通常有两种分割方法:
(1) 根据图像的两种特性进行分割:
a.根据各个像素点不同灰度不连续性进行分割;
b.根据同一区域具有相似灰度的特性进行分割;
(2) 根据分割的处理策略不同进行分割:
a.并行分割:所有的判断和决策可以独自进行;
b.串行分割:后期的处理依赖前期的运算结果;
目前,图像分割方法有很多,主要分为:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法,这几种算法分类如表2.1所示:
表2.1 算法分类
分类边界 (不连续性)区域 (相似性)
并行处理 边缘检测阈值分割、聚类等
串行处理 边缘跟踪区域生长,分裂合并
2.1.1.1基于阈值的分割方法
灰度阈值分割法[7]是图像分割中应用数量最多的一类。若图像中目标和背景分属不同的灰度集合,而且这两个集合可用一个阈值T进行分割,那么就可以采用阈值分割灰度级的方法将图像中分割出背景和目标区域。因此阈值分割方法实际上是输入图像f到输出图像g的变换,公式如2.1所示:
(2.1)
其中,T为阈值,目标物体的图像元素g(i,j)=1,反之背景的图像元素g(i,j)=0。
由此可见,阈值分割算法的关键是确定阈值,如果能确定一个合适的阈值就可准确地将图像分割开来。在阈值确定后,将阈值与像素点的灰度值逐个进行比较,而且像素分割可对各像素并行地进行,分割的结果直接给出图像区域。但实际应用中阈值设定易受噪声和光照的影响[8]。
阈值的选取方法按分割的区域范围又分为全局阈值分割和局部阈值分割,具体分析如下:
(1) 全局阈值分割
a. 直方图法:它是指利用图像的灰度直方图或者经过变换的直方图来确定二值化阈值的方法。如果图像状况比较理想时,即图像中的文字和背景灰度级相差较大时,灰度直方图便会呈现出明显的双峰形状,这时就可以选择双峰中间谷底的灰度值作为阈值[5]。
摘要
随着图像处理技术和模式识别的不断发展,支票自动识别日益成为金融自动化的重要组成部分。而版面分析作为支票自动识别的前提条件,正随着支票版面的规范化和一体化,日益受到人们的重视。
支票版面分析系统的关键在于,确保版面中各功能单元进行高精度的分割,并得出其位置信息,为之后的版面识别做准备。因此在系统设计过程中,作者从实际工作出发,总结了当前数字图像分割领域的一些先进方法和思想,并以图像分割技术为基础,提出了一个完整的支票版面分析系统。该系统分为四大部分:预处理模块、倾斜校正模块、边界跟踪模块、区域提取模块。具体如下:
(1) 预处理模块研究了基于阈值分割技术的二值化、频域和空间域的平滑去噪;
(2) 倾斜校正模块研究了基于霍夫变换的直线校正方法;
(3) 边界跟踪模块主要是对支票图像边缘进行增强;
(4) 区域提取模块基于国内银行支票的特征,首先分析了金额区域和印章区域的提取,然后研究了基于连通域的区域提取方案。
通过分析比较程序运行结果,提出了一系列新颖的处理方法,如基于霍夫变换的倾斜校正、基于色度空间HSI的印章提取等,为支票版面分析提供了更加丰富的实现途径。
查看完整论文请+Q: 351916072
关键字:字版面分析、图像分割、版面识别、边界跟踪、霍夫变换、印章提取
Keyword:document analysis,image segmentation,layout recognition, boundary tracking, Hough transform, seal extraction目 录
第1章 绪论 1
1.1 引言 1
1.2 金融票据处理的基本概念 1
1.3 金融票据处理的发展现状 1
1.4 本文的研究内容及结构安排 2
第2章 图像分割与版面分析原理 4
2.1 数字图像分割技术的介绍 4
2.1.1 分割技术的分类 4
2.1.1.1 基于阈值的分割方法 5
2.1.1.2基于区域的分割方法 6
2.1.1.2.1 区域生长法 6
2.1.1.2.2分裂合并法 7
2.1.1.3基于边缘的分割方法 8
2.1.2 霍夫变换 9
2.2 票据版面的描述 10
2.2.1 票据组成 10
2.2.2 票据版面的基本定义 11
2.2.3 票据版面中各部分之间的关系 12
2.3 票据版面分析系统原型 13
2.4 票据版面学习 14
2.5 票据版面分析的难点 14
第3章 关键技术研究和试验 16
3.1 票据版面的数学模型 16
3.2 预处理 16
3.2.1 支票的二值化 16
3.2.2 图像平滑处理 17
3..3 支票倾斜校正 19
3.4 提取票据功能单元信息 21
3.4.1 票据类型特征的提取 22
3.4.2 票据功能单元提取方案 22
3.4.2.1 提取金额区 22
3.4.2.2 提取印章区 22
第4章 系统设计与测试 25
4.1 预处理 25
4.2 边界跟踪 26
4.2.1 前期准备 26
4.2.2 边界跟踪开始 27
4.3 区域提取 28
第5章 总结与展望 30
5.1. 总结 30
5.2 展望 30
参考文献 32
致谢 35
文献翻译 36
第1章 绪论
金融票据的版面分析是图象处理重要研究领域,也是票据识别的前提条件,因此是金融票据自动化处理系统的关键部分。随着模式识别的研究不断深入以及现实中日益增长的业务需求,票据版面分析与识别成为关注焦点。本章首先介绍金融票据自动处理的一些基本概念,然后陈述研究目的、意义以及发展现状.最后指出本文的主要研究内容以及篇章分布结构。
1. 1 引言
随着我国经济的迅猛发展以及全国票据交换系统的推广,金融票据的使用量出现了跨越式增长。随着经济全球化带来的行业竞争不断加剧,国内金融业对票据自动化处理的需求也在逐渐增大,而数字图像处理技术与模式识别技术的不断发展与支票一体化、规范化的趋势也给国内支票分析与识别带来了更广泛的应用前景。
1. 2 金融票据处理的基本概念
金融票据自动处理过程主要包括版面分析和版面识别两部分,其中:
版面分析[1](Document Analysis)是指分析给定的图象结构,提取出相互独立的图象要素并对其进行解释的过程。具体而言,系统需要分析待处理的票据图像的逻辑结构、辨识出其种类、从原始图像中定位并提取出相互独立的子图像、检测并去除票据中的表格框线,将填写的信息从背景和噪声中分离出来等一系列处理过程。这其中任何一步的错误都将可能影响支票最终的识别结果。
版面识别(Document Recognition)是指处理版面分析的结果,对版面内的图形、图象信息和要素之间的结构关系进行识别和理解、最终实现对填写域识别的过程。具体而言,是对填写域(如印刷体数字,手写体汉字、手写体数字以及印章)的识别。
我们可以将版面分析看成票据自动处理系统的前处理过程,将系统在版面分析之后的处理过程归为版面识别过程[2],二者相互作用、相互制约,在系统中具有同等地位。本文主要针对版面分析处理过程进行分析,研究其中的关键技术,并给出了相应的实现方案。
1. 3 金融票据处理的发展现状
随着计算机技术不断提升和广泛运用,金融领域大量重复的日常业务都逐渐实现了电子化、自动化、智能化,其信息管理的能力大大提高。尽管支票作为个人、单位团体等用来直接进行支付现金的工具,在国内已经实行多年,但在金融票据处理方面,多数银行仍停留在手工录入阶段,人工劳动强度较大,从而投入的人力物力较多,影响计算机系统发挥更大的效益,特别是事后监督业务,往往同样的数据需要重复输入。因此,票据自动分析和识别成为金融业务自动化的关键。
因为金融票据的版面都具有表格特征,所以表格的版面分析成为票据版面分析的重要任务。表格的版面分析[3]主要分为物理结构和逻辑结构[4]两个分析方面。其中,物理结构分析分为有先验知识分析和无先验知识分析两种。有先验知识分析即已知部分表格布局的情况下对表格中某项信息进行定位并提取,这样可保证版面分析的准确性和速度,但同时牺牲了效能。无先验知识分析即不需输入票据的特征信息和格式,通常借助支票左右角的基线和特征标志来识别支票类型。目前对这两种布局结构分析的研究都取得了一定进展,其中有先验知识的表格版面分析已成功在部分票据版面分析系统中应用。而由于中文表格的复杂性和多样性,使得无先验知识的表格版面分析仍有一定的难度。另外,逻辑结构识别的研究目前还非常有限。Watanabe等人曾提出采用一个二叉树从逻辑上来表示表格文件的布局结构[4]。还有,Douglas等人曾利用自然语言理解的方法对表格进行识别与理解。
中文版面分析与英文版面分析相比较而言,有其特有的困难:(1)汉字票据版面相对复杂,有许多独到之处。(2) 汉字是图形化的字符,笔画较多,结构复杂,在区分汉字版面中的文本与非文本部分上有一定的难度。尽管如此,我国中文版面分析的研究也取得了值得肯定的的成绩,如清华大学已经成功研制出了大型中文古籍《四库全书》自动版面分析系统[5]。
1. 4本文的研究内容及结构安排
本文提出了支票版面分析系统原型,对其中的关键技术做了一些深入讨论,并给出了部分实验结果。最后,作者对版面分析系统中部分模块提出了一些改进思路。
文章的具体分布结构如下:
第1章概述支票版面分析系统的背景以及本文的组织结构;
第2章介绍了数字图像分割技术和版面分析的原理;
第3章提出了一个完整的版面分析系统的原型,即包括倾斜校正、预处理、边界跟踪、区域提取四个模块,然后分别就各模块中的主要功能做了讨论,给出了具体可行的方案;
第4章展示了系统设计和程序运行结果;
第5章对本文进行总结,并进行展望。
第2章 图像分割与版面分析原理
本章第一节首先介绍了一些数字图像分割算法的基本概念,第二节提出了票据版面的数学模型,第三节介绍了支票本身的背景知识,第四节提出了完整的票据版面分析系统模型,第五节分析了票据版面学习,第六节介绍票据版面分析的难点。
2.1 数字图像分割技术的介绍
图像分割[6](Image Segmentation)是指把图像分成若干个特定的、具有独特性质的区域并提取出感兴趣目标的技术和过程。它通常是对图像进行分析、识别、压缩编码等处理的前提和重要组成部分,因此图像分割在理论研究和实际应用中都得到了人们的广泛重视。
图像经过分割处理后得到的子区域需要同时满足均匀性和连通性的条件,其中均匀性是指该区域中的所有像素点都满足基于灰度、纹理、彩色等特征的某种相似性准则;连通性是指在该区域内存在链接任意两点的路径。
2.1.1 分割技术的分类
根据分割方法的不同,通常有两种分割方法:
(1) 根据图像的两种特性进行分割:
a.根据各个像素点不同灰度不连续性进行分割;
b.根据同一区域具有相似灰度的特性进行分割;
(2) 根据分割的处理策略不同进行分割:
a.并行分割:所有的判断和决策可以独自进行;
b.串行分割:后期的处理依赖前期的运算结果;
目前,图像分割方法有很多,主要分为:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法,这几种算法分类如表2.1所示:
表2.1 算法分类
分类边界 (不连续性)区域 (相似性)
并行处理 边缘检测阈值分割、聚类等
串行处理 边缘跟踪区域生长,分裂合并
2.1.1.1基于阈值的分割方法
灰度阈值分割法[7]是图像分割中应用数量最多的一类。若图像中目标和背景分属不同的灰度集合,而且这两个集合可用一个阈值T进行分割,那么就可以采用阈值分割灰度级的方法将图像中分割出背景和目标区域。因此阈值分割方法实际上是输入图像f到输出图像g的变换,公式如2.1所示:
(2.1)
其中,T为阈值,目标物体的图像元素g(i,j)=1,反之背景的图像元素g(i,j)=0。
由此可见,阈值分割算法的关键是确定阈值,如果能确定一个合适的阈值就可准确地将图像分割开来。在阈值确定后,将阈值与像素点的灰度值逐个进行比较,而且像素分割可对各像素并行地进行,分割的结果直接给出图像区域。但实际应用中阈值设定易受噪声和光照的影响[8]。
阈值的选取方法按分割的区域范围又分为全局阈值分割和局部阈值分割,具体分析如下:
(1) 全局阈值分割
a. 直方图法:它是指利用图像的灰度直方图或者经过变换的直方图来确定二值化阈值的方法。如果图像状况比较理想时,即图像中的文字和背景灰度级相差较大时,灰度直方图便会呈现出明显的双峰形状,这时就可以选择双峰中间谷底的灰度值作为阈值[5]。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/txgc/2201.html