图像中文字的提取【字数:10292】

人类社会的进步发展,以及现在的社会已经是大数据的信息化社会了,我们生活中一直能遇到的就是信息了,那么多信息天花乱坠,想要很好地、高效地提取出有用的信息,来通过计算机来实现。是我们现如今需要研究的。数字图像处理这一技术伴随着我们人类社会的文明发展。我们在今后的图像文字识别中需要对这一技术加以优化及研究。本文首先是对国内外图像文字提取的技术与方法的了解与归纳总结、以及现如今的研究现状与发展趋势,对现有的图像文字的定位与提取技术的优缺点进行研究并介绍了本设计所需使用的软件matlab,包括matlab编程的语言,图像边缘检测、二值化处理、形态处理与噪声剔除等流程。并进一步利用算法对图像进行处理,有用到图像的转化,图像编码技术、复原、模块分组等。最后根据算法的仿真的分析结果得到本文提出的新算法可以达到数字图像识别需求。
目 录
1.绪论 1
1.1图像文字提取的背景 1
1.2图像文字提取的研究现状 3
1.2.1国外研究现状 3
1.2.2国内研究现状 3
1.3论文研究主要内容 4
2. 数字图像处理相关技术 5
2.1边缘检测技术 5
2.1.1 梯度算子 5
2.1.2 Laplace算子 6
2.2 图像二值化处理技术 6
2.3 图像灰度直方图技术 7
2.4 图像识别的关键步骤 8
2.4.1图像分割 8
2.4.2图像分割的三种分割法 9
2.4.3 图像特征提取和分类 11
3. 图像文字识别算法 13
3.1 图像文字识别基本流程 13
3.2 传统图像文字定位算法 13
3.3 图像文字定位算法改进 14
4.图像文字识别的高效实用工具——Matlab 16
4.1 Matlab软件简介 16
4.2 用Matlab研究图像文字识别的优点 16
4.2.1 程序实现 16
结论 25
致谢 26
参考文献 27
1.绪论
1.1图像文字提 *好棒文|www.hbsrm.com +Q: #351916072# 
取的背景
在数字图像处理的发展领域内,自动识别和提取文字的系统使得我们对处理图像问题得以更加的便捷以及智能化了。而且使得人们开始越来越关注这一技术,进行改进和优化。我们都知道图像中是许多对于我们很有帮助的信息的,所以作为图像提取文字这一关键技术就使得我们越来越重视这一研究,也是一件非常有意义,对未来有帮助的研究。
1.2图像文字提取的研究现状
1.2.1国外研究现状
最常见的图像处理,那就是将低分辨率的图片转换为高分辨率的图片了。这样可以保证获取到的图片信息中的完整性。通过图像增强使、复原、编码、压缩等方法来实现所需要的。在图像处理的发展史上,美国的JPL是第一个成功的实验室了。他们利用了图像的灰度处理以及去除噪声、几何校正等方法进行了处理。并参考了月球的所处环境以及太阳对月球的影响,在种种因素的牵制下,运用了计算机成功得画出了月球表面的地图。再根据后来有了飞船登月所带回来的关于月球的图片信息,进一步的对图像进行了复杂处理。最终得到了最完整的月球全景图,卫星图以及最后的彩色图。取得了很大的成功。导致了数字图像处理这门学科的产生。在随后的宇航空间技术,数字图像处理都发挥了巨大的作用。国外的学者基于图像检测的三种方法提出了各自的算法设计思想。Hualtilon在2001年提出了基于图像文字区域角点密集特征和带状分布特征的区域定位算法,并采用焦点检测与合并对图像中的文字区域进行初步确定,并通过文字区域膨胀和分解处理得到候选文字区域集合,最后通过对候选文字区域集合的相关特征进行分析得到最终的文字定位区域定位结果。
1.2.2国内研究现状
其次是纹理的检测方法,这种方法的话实在每个像素区域进行检测看能否找到相应文字,而且这种检测方法是适用于复杂背景图像的检测的,但是由于复杂程度比较高有的时候可能找不准像素区域导致检测出错误的文字。最后就是区域检测法了,这种方法呢比较适合二值图像,具有局限性。因为二值图像本身色系单调,所以检测的处理速度也肯定是最快的,不过也仅限于二值图像,实际操作中我们可以先把彩色图像转换为二值图像,之后再来进行文字检测[7]。
检测完图像的文字,当然就要进行图像中文字的分割和提取了。现有的图像分割的方法有很多种,有阈值分割方法,边缘检测方法,区域提取方法,结合特定理论工具的分割方法等。分割字符的时候要考虑到图像中字符的特性,因为有的图像文字比较集中,而有的文字的字体大小不是统一的。结合文字的自身特性和现有的图像分割方法进行研究,也是我们所要学习与研究的一部分。
目前,我们所使用的字符的识别技术已经走向了成熟,我们可以用OCR系统来完成我们需要识别的字符。但是,有可能会因为分割出来的文字的图像分辨率较低,而可能不能到达到我们所需要的效果,识别的文字可能会有误差。所以我们需要对分割出来的文字进行以下增强分辨率的处理然后再用系统识别。当然,我们也可以升级现有的字符识别系统来达到我们的目的。
现如今科技的飞速发展,计算机、通信技术的增强。我们生活在大数据下,什么都是数字化的,文字、声音以及更多的图像、视频等信息都是以数字形式存在的。在这种趋势下,国际标准MPEG7的制定就是为了对现在多媒体的研究以及检索。由于现在的视频内有很多信息的存在。我们用肉眼去获取信息的速度与效率比计算机处理起来要快。所以攻克图像文字提取这一任务是比较艰巨的,现在很多的实验都围绕这一工作中心而展开,这也需要科研者一起来攻克难关。
1.3论文研究主要内容
本文是以数字图像处理为基础的进行图像文字提取作为主要研究对象的。通过学习了边缘检测技术、灰度处理、二值化处理以及图像分割来对图像进行分析。提取图像中的文字首先就是要对图像进行识别,并进行灰度处理,根据自己所需要的字符分割图像,进行二值化处理,最后提取出需要的字符。
本文在这些基础上研究了图像中车牌号的提取和图书馆索引号的提取。两者都是相对比较简单的。根据目前对数字图像处理基础的研究,再加上自己的理解,做了一些简单的图像文字提取。主要是了解其中的每一步骤,并得到最后的答案,这将为以后的研究提供帮助。现在的科技发展那么迅速,越往后对图像文字的处理,就越需要优化,要做出不降低图片质量又可以提取出高清文字的技术,这将是未来我们要去研究的主要方向。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/dzkxyjs/542.html

好棒文