图像识别的智能计算器设计
摘 要计算器是人们常用的一件用来进行数学运算的工具。本文研究的是基于图像识别的智能计算器,相对于普通计算器使用更方便,计算更准确。本文中智能计算器的核心是字符识别,字符识别是模式识别的一种,在智能生活方面起着不可替代的作用。通过很多人的努力,字符识别领域已经取得很丰厚的研究成果。字符识别的应用极大的方便了人们日常的生产生活。本文可实现通过MATLAB平台识别获取的图片上的印刷体数字和运算字符,生成算式进行计算并输出结果。研究字符识别的方法多种多样,本文采取了模板匹配法,正确率高,速度快。经实验证明本文对印刷体字符的识别具有鲁棒性。
目 录
摘 要 I
ABSTRACT II
目 录 III
第一章 绪论 1
1.1 智能计算器的背景介绍 1
1.2 研究的难度 2
1.3 数字识别研究现状 3
1.4 常用软件和方法 4
1.4.1 使用软件介绍 4
1.4.2 系统功能分析 5
第2章 系统方案设计 6
2.1 总体方案设计思路 6
2.2图像预处理 6
2.2.1 获取图像 7
2.2.2 图像类型转换 7
2.2.3 图像去噪 10
2.3字符分割 11
2.3.1 字符分割基本方法 11
2.3.4 所选方法 12
2.4 字符识别 14
2.4.1 字符识别的方法 15
2.4.2 所选方法 17
2.5 模板库的建立 20
2.5.1 字符的归一化 20
2.5.2 添加字符模板 21
2.6 运算符处理 21
2.6.1 计算器的实现功能 21
2.6.2 算式生成 22
2.6.3 容错功能 22
第3章 GUI界面设计 24
3.1 gui设计介绍 24
3.2 界面设计 24
3.3 功能设计 25
3.4 图像算式选择 26
第4章 调试结果与分析
*好棒文|www.hbsrm.com +Q: %3^5`1^9`1^6^0`7^2#
28
4.1 程序运行和调试流程 28
4.2 程序调试? 28
第五章 结论 31
致谢 32
参考文献 33
附录1?外文翻译? 35
附录2?部分程序 45
第一章 绪论
1.1 智能计算器的背景介绍
计算器是指可以进行数学运算的电子装置。计算工具有很久的发展历史,从早期的手动式计算器,如算盘、筹测,到后来的机械式计算器,比如计算尺。这些都为现代社会计算工具的发展奠定了良好的基础。到了20世纪70年代才出现了第一款掌上计算器。
当前的计算器的形式分为实物计算器和软件形式的计算器。随着现在PC电脑和智能手机、平板的普及,软件式计算器越来越多,人们越来越习惯于使用应用软件。软件式计算器有望取代传统的实物计算器。
目前网络上出现了很多手机端智能计算器软件应用,一种计算器的智能体现在触摸屏、真人语音、实用性计算等方面。随着字符识别技术的进步,又出现另一种智能计算器:照相式计算器。它的出现是为了解决人工输入浪费时间,点错数字和运算符,正确率低的问题。进入简单的APP页面之后,手机自动跳转到拍照模式,对准需要计算的算式,就能即时显示出正确的计算结果。这款应用的界面如图1.1所示:
图1.1??照相式计算器应用界面
拍照式计算器的基石是图像识别技术,图像识别技术是近三十多年来一直发展的技术,它属于模式识别。自动化设备的高度发展推进了模式识别、数字图像处理、人工智能等技术的发展。
模式识别[1]是基于应用的一门学问,它实际上把目标对象分类,被分类的对象可以是照片、电脑图像、检测的信号波,等一切需要分类的。模式识别对机器视觉很重要,机器用相机获取图像,然后将图像的描述信息分析生成。
图像识别旨在从图像中自动挖掘出需要的物理信息,俭省人力,借助计算机代替人力完成大量工作,来解决人类的物理器官所不能完成的东西。图像识别技术主要是对图片进行输入、加工和输出。字符识别,也是属于图像识别。字符识别应用十分广泛,如汽车车牌识别,票据识别,设备编号识别等。
图1.2??两种款式的现役设备编号标牌
光学字符识别OCR(Optical Character Recognition)是通过电子装置(如数码相机、扫描仪)对打印纸上的字符检查,通过检测黑暗和光模式,以确定它们的形状,然后使用字符识别技术将形状转化为计算机可以处理的文本。
一个OCR系统的目的是把视觉形象做一个转变,使映像中的图像资料信息继续保存,在图像内的表格和文本数据的表,全变成计算机文字,可以压缩最终图像数据的大小,使得识别出的文本方便再次使用。同时,它可以节约人力和时间。从图像到结果输出应经过视频输入,图像处理,文本特征提取,匹配识别后,最后由手动校正将错的文字更正,并输出结果。
印刷体数字识别是字符识别的一个分支,它常用的方法有:模板匹配法,特征提取法等。模板匹配法较简单,但是需要大量匹配,速度慢。特征提取法是以提取特征值为前提,关键是选取健壮的特征值,它的特点是:计算量小,识别速度快。
1.2 研究的难度
智能计算器的字符识别包括两部分数字识别和运算符识别,数字识别一共只有10种,运算符也不复杂,而且笔画简单,看起来问题不是特别困难。但是研究测试表明:它比印刷体汉子识别率要低一些,而仅仅优于手写体汉字识别。因此在研究是会遇到以下困难:
数字的形体很相近,容易出现错误
由于数字和运算符没有上下文关系,每个字代表一个特定的含义,所以比文字的识别单词识别精度的要求更加苛刻。其严谨度在财务,统计等领域是不言而喻的。
大批量数据处理对系统速度一般都有颇高的要求,很多理论上很完美但速度过低的方法都是行不通的。?大型系统要求数据处理速度一般都相当高,很多理论完美但速度过于落后的方法是不可行的。
由于不同的环境中,拍摄的照片有污损的情况有很大的不同,除了传统的背景污染,它也可具有字体磨损,笔划中断出乎意料折痕入侵等。照片本身也可能存在于数字上下等不规则转动等情形。
本次项目的研究对我来说确实有很大的难度,因为因为对字符识别或者图像
目 录
摘 要 I
ABSTRACT II
目 录 III
第一章 绪论 1
1.1 智能计算器的背景介绍 1
1.2 研究的难度 2
1.3 数字识别研究现状 3
1.4 常用软件和方法 4
1.4.1 使用软件介绍 4
1.4.2 系统功能分析 5
第2章 系统方案设计 6
2.1 总体方案设计思路 6
2.2图像预处理 6
2.2.1 获取图像 7
2.2.2 图像类型转换 7
2.2.3 图像去噪 10
2.3字符分割 11
2.3.1 字符分割基本方法 11
2.3.4 所选方法 12
2.4 字符识别 14
2.4.1 字符识别的方法 15
2.4.2 所选方法 17
2.5 模板库的建立 20
2.5.1 字符的归一化 20
2.5.2 添加字符模板 21
2.6 运算符处理 21
2.6.1 计算器的实现功能 21
2.6.2 算式生成 22
2.6.3 容错功能 22
第3章 GUI界面设计 24
3.1 gui设计介绍 24
3.2 界面设计 24
3.3 功能设计 25
3.4 图像算式选择 26
第4章 调试结果与分析
*好棒文|www.hbsrm.com +Q: %3^5`1^9`1^6^0`7^2#
28
4.1 程序运行和调试流程 28
4.2 程序调试? 28
第五章 结论 31
致谢 32
参考文献 33
附录1?外文翻译? 35
附录2?部分程序 45
第一章 绪论
1.1 智能计算器的背景介绍
计算器是指可以进行数学运算的电子装置。计算工具有很久的发展历史,从早期的手动式计算器,如算盘、筹测,到后来的机械式计算器,比如计算尺。这些都为现代社会计算工具的发展奠定了良好的基础。到了20世纪70年代才出现了第一款掌上计算器。
当前的计算器的形式分为实物计算器和软件形式的计算器。随着现在PC电脑和智能手机、平板的普及,软件式计算器越来越多,人们越来越习惯于使用应用软件。软件式计算器有望取代传统的实物计算器。
目前网络上出现了很多手机端智能计算器软件应用,一种计算器的智能体现在触摸屏、真人语音、实用性计算等方面。随着字符识别技术的进步,又出现另一种智能计算器:照相式计算器。它的出现是为了解决人工输入浪费时间,点错数字和运算符,正确率低的问题。进入简单的APP页面之后,手机自动跳转到拍照模式,对准需要计算的算式,就能即时显示出正确的计算结果。这款应用的界面如图1.1所示:
图1.1??照相式计算器应用界面
拍照式计算器的基石是图像识别技术,图像识别技术是近三十多年来一直发展的技术,它属于模式识别。自动化设备的高度发展推进了模式识别、数字图像处理、人工智能等技术的发展。
模式识别[1]是基于应用的一门学问,它实际上把目标对象分类,被分类的对象可以是照片、电脑图像、检测的信号波,等一切需要分类的。模式识别对机器视觉很重要,机器用相机获取图像,然后将图像的描述信息分析生成。
图像识别旨在从图像中自动挖掘出需要的物理信息,俭省人力,借助计算机代替人力完成大量工作,来解决人类的物理器官所不能完成的东西。图像识别技术主要是对图片进行输入、加工和输出。字符识别,也是属于图像识别。字符识别应用十分广泛,如汽车车牌识别,票据识别,设备编号识别等。
图1.2??两种款式的现役设备编号标牌
光学字符识别OCR(Optical Character Recognition)是通过电子装置(如数码相机、扫描仪)对打印纸上的字符检查,通过检测黑暗和光模式,以确定它们的形状,然后使用字符识别技术将形状转化为计算机可以处理的文本。
一个OCR系统的目的是把视觉形象做一个转变,使映像中的图像资料信息继续保存,在图像内的表格和文本数据的表,全变成计算机文字,可以压缩最终图像数据的大小,使得识别出的文本方便再次使用。同时,它可以节约人力和时间。从图像到结果输出应经过视频输入,图像处理,文本特征提取,匹配识别后,最后由手动校正将错的文字更正,并输出结果。
印刷体数字识别是字符识别的一个分支,它常用的方法有:模板匹配法,特征提取法等。模板匹配法较简单,但是需要大量匹配,速度慢。特征提取法是以提取特征值为前提,关键是选取健壮的特征值,它的特点是:计算量小,识别速度快。
1.2 研究的难度
智能计算器的字符识别包括两部分数字识别和运算符识别,数字识别一共只有10种,运算符也不复杂,而且笔画简单,看起来问题不是特别困难。但是研究测试表明:它比印刷体汉子识别率要低一些,而仅仅优于手写体汉字识别。因此在研究是会遇到以下困难:
数字的形体很相近,容易出现错误
由于数字和运算符没有上下文关系,每个字代表一个特定的含义,所以比文字的识别单词识别精度的要求更加苛刻。其严谨度在财务,统计等领域是不言而喻的。
大批量数据处理对系统速度一般都有颇高的要求,很多理论上很完美但速度过低的方法都是行不通的。?大型系统要求数据处理速度一般都相当高,很多理论完美但速度过于落后的方法是不可行的。
由于不同的环境中,拍摄的照片有污损的情况有很大的不同,除了传统的背景污染,它也可具有字体磨损,笔划中断出乎意料折痕入侵等。照片本身也可能存在于数字上下等不规则转动等情形。
本次项目的研究对我来说确实有很大的难度,因为因为对字符识别或者图像
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jxgc/zdh/3043.html