名片图像的信息识别算法研究

摘 要  在这瞬息万变的时代,人们常常会通过交换名片让别人了解自己、记住自己,便捷和简洁性使得名片得以广泛使用,成为备受人们亲睐的社交工具,但与此同时,铺天盖地的名片信息管理却成了不得不解决的问题。传统的人工录入采集名片信息的方式,不仅会耗费大量的人力物力,而且信息的精准度和完整度得不到保障,因此如果能实现自动录入名片信息,其实用价值将大大提高。本文的主要研究的是英文名片,最终实现的是英文名片图像信息的字符识别。本文最先开始是详细的介绍了名片信息图像识别算法研究的背景、现状和意义,然后介绍了名片图像识别的基本过程,其中一般的处理步骤是图像采集、预处理、版面分析、字符分割和字符识别。其中图像采集采用的是手机拍摄的方式,图像预处理是基于OpenCV库,字符识别是基于 tesseract-ocr 识别引擎,最终实现了对一般英文名片信息的识别工作。摘 要
目 录
ABSTRACT
第 1 章 绪论 1
1.1名片信息识别研究的背景及意义 1
1.2 名片信息识别的研究现状 2
1.3 名片图像的基本特征 2
1.4 名片信息识别的基本步骤 3
1.5 本文内容安排 4
第 1 章 名片图像识别的开发环境 5
2.1 OpenCV库 5
2.2 Tesseract安装 9
2.3 本章小结 11
第 3 章 名片图像的预处理 11
3.1 引言 11
3.2 名片彩色图像的灰度化 11
3.3 名片彩色图像的二值化 12
3.4 本章小结 15
第 4 章 名片图像的版面分析 16
4.1 名片图像版面分析概论 16
4.2 名片图像版面分析常用方法 16
4.3本章小结 17
第 5 章 名片图像字符识别 17
5.1 图像字符识别概况 17
5.2 基于轮廓检测的字符分割方案 19
5.2.1 引言 19
5.2.2 轮廓检测 19
5.3 Tesseract识别引擎概述 23
5.3.1
 *好棒文|www.hbsrm.com +Q: ¥3^5`1^9`1^6^0`7^2$ 
字符处理步骤 23
5.3.2 多语言支持 24
5.3.3 名片字符识别 25
5.4 本章小结 27
第 6 章 总结与展望 27
参考文献 30
致 谢 31
附 录 32
英文文献翻译 33
第 1 章 绪论
1.1 名片信息识别研究的背景及意义
名片在日常生活中可以说是随处可见 ,尤其是在商业活动中,人们习惯于用交换名片这样的方式与客户、合作对象建立联系,以达到拓宽人脉、扩大交友圈的目的。由此看来,收集纸质名片并管理名片上的资料信息的确是一项很有必要也很有现实意义的工作。但是,面对数量众多、版式不一的名片信息,如何对其进行有效的管理却成了问题。如果仅仅依靠人工整理与保存纸质名片,那么很容易造成效率低下、名片损坏、名片遗失等问题;如果采用传统的人工采集录入名片信息的方式,又容易造成人力资源的浪费,而且不能保证信息的精准度和完整度。除此之外,还需要建立相应数据库以支持信息的筛选、分类、管理和查找,这就意味着用户要对这些信息进行更新和维护。因此,实现名片信息自动识别的重要性显而易见。
近年来,飞速发展的信息技术使得字符识别领域取得了可观的成就,并逐渐被应用于实际生活。目前主要运用到的字符识别技术--光学字符识别(OCR,Optical Charaeter Recognition)[1],其发展史可追溯到二十世纪早期,经过将近一个世纪的继承和发展名,其系统与技术应用已基本完善,特别是对于标准印刷字体的识别,已十分成熟并广泛应用。我们国家从八十年代开始研究 OCR 技术,致力于开发其对印刷体中文的字符识别,目前已取得一定的成就。我们国内的研究主要分成两个方向:脱机的手写汉字识别技术的研究;专用的OCR系统研制和开发,如税票OCR系统、车牌OCR系统、名片OCR系统及信封OCR系统等。在一定程度上,专用OCR系统开发拓宽了OCR技术应用领域,相关应用领域自动化的程度也得到了长足的提高[2]。但是专用OCR系统所处理的对象从某种意义上来说是特定的,所以在系统设计和实现的过程中会遇到比较多的技术问题和难点,不过由于这些问题基本上都是特定的,所以一旦解决了其中的一个问题,有可能就解决了一类问题。换句话说,这将促进相关研究人员开发新的方法和途径来解决这些问题和难点,从而提升理论价值以及实际应用价值。OCR技术实际上就是一种图像信息数字化的过程,具体说来就是将文档资料和各类纸质信息快速度、高质量地进行数字化的同时将成本降到最低,从而最大化开发和利用信息资源,同时解放劳动力。OCR技术主要通过光学输入设备,如扫描仪、手机、平板电脑等移动设备来采集纸张上的文字图片信息,再通过专业的识别软件将文字从图像转换成文本。当下,如何将OCR 技术尽可能的应用到人们生活中的方方面面是各路学者们研究的热的。本文所讨论的名片信息的图像识别便是其中一个研究方向和应用分支。
由上可见,如果能够充分开发和利用OCR 技术对种类繁多、信息量巨大的名片信息进行存储和管理,至少在名片信息的管理领域将是一次对劳动力的全面解放,同时也将给人们带来更多的便利。
1.2 名片信息识别的研究现状
尽管我国相关业内人士从二十世纪后期就开始了对于 ocr 技术的研究,但将其应用于名片管理领域实际上是近年来才开始的。互联网时代的到来使得人们寻求更加简单的管理名片的方式,作为移动终端的手机就是一种非常方便的应用场景,许多研发 ocr 系统的公司在这期间涌现出来,他们纷纷推出自主研发的名片识别系统,该领域一时间可谓是百家争鸣。其中以名片全能王、汉王名片通为代表,实现了名片管理以及自动识别功能,并且兼容多种语言的名片识别。汉王公司推出的名片识别系统,越来越强大的功能加上不断提高的识别率,到目前为止已有十多个版本,是国内名片识别系统市场当之无愧的领跑者。当然在服务器端也可以应用名片识别系统。  
目前,名片识别主要针对的是中英文名片。例如:基于阶段识别的方法;模板匹配进行版面分析的方法。上述方法理想化了名片,忽略了在实际操作过程中可能遇到的例如名片版面复杂不一,字体、字号变化等问题,还有可能存在字符粘连问题,这些方法均只适用于名片版面相对固定的情况。
  此外,目前名片识别还存在以下不足:由于算法运算量过大,其应用于移动设备发展较缓慢;经典的名片版面分析算法如连通域法、模板匹配算法针对的是较固定的名片版式,速度慢而且运算量大;名片识别系统最起码要求能够识别中英文两个语种,但是迄今为止仍然没有出现一个OCR技术同时识别中英两类文字,这将极大的影响对中英文字符混排名片的精准识别;并没有创建完善的检测以及纠错系统以应对名片识别过程中出现的累积的错误信息。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jxgc/zdh/3048.html

好棒文