联机手写输入软件的设计与实现
联机手写输入软件的设计与实现[20191215152207]
本人签名: 日期: 摘 要
伴随着平板电脑和智能手机的普及,手写输入的应用为使用者提供了极大地方便。在金融等领域,很多服务开始转向自助设备,但是这些自助设备大都采用Windows操作系统,系统本身没有或仅提供简单的手写输入功能。此时,汉字录入将成为自助设备推广的瓶颈之一,手写汉字识别成了解决这个问题的最好选择。
本课题针对以上问题,在Windows环境下,采用C#和C语言编程,设计了基于BP神经网络的联机手写输入的人机交互界面和识别算法。具体工作如下:
1、 分析手写汉字识别的研究现状和以及本课题研究背景。
2、 确定系统设计目标、模块组成、算法选择和设计流程。
3、 编写人机交互界面,获取输入轨迹,对轨迹进行孤点消除并映射成二值化图像。
4、 采用形态学操作对汉字进行笔迹平滑,仿射变换进行方向矫正,线性归一化进行特征区域提取和归一化。
5、 获取特征区域的灰度特征,根据每个特征向量的特征数目和模式类数量,搭建BP神经网络,利用样本对神经网络进行训练和测试。
本课题通过大量样本对系统进行测试和参数修正,最终结果证明系统对手写汉字识别具有较好的识别效果。
查看完整论文请+Q: 351916072
关键字:汉字识别;统计方法;特征提取;BP神经网络
目录
摘 要 II
ABSTRACT II
目录 II
第一章 绪论 2
1.1手写汉字识别研究的背景及意义 2
1.1.1模式识别技术 2
1.1.2手写汉字识别 2
1.2国内外研究现状 2
1.3手写汉字识别的应用前景 2
1.4本文研究内容和章节安排 2
第二章 手写汉字识别系统方案设计 2
2.1系统设计目标 2
2.2汉字识别算法选择 2
2.2.1基于结构方法的汉字识别 2
2.2.2基于统计方法的汉字识别 2
2.2.3识别算法比较与分析 2
2.3系统模块组成 2
2.3.1轨迹提取模块 2
2.3.2预处理模块 2
2.3.3分类与识别模块 2
2.4本章小结 2
第三章 汉字识别预处理 2
3.1输入轨迹提取 2
3.2孤点消除 2
3.3笔迹平滑 2
3.3.1膨胀 2
3.3.2腐蚀 2
3.3.3开操作与闭操作 2
3.3.4形态学操作结果 2
3.4图像几何变换 2
3.5图像线性归一化 2
3.6本章小结 2
第四章 基于神经网络的汉字识别 2
4.1神经网络基本原理 2
4.1.1神经网络的最基本形式 2
4.1.2神经网络的训练算法 2
4.1.3 BP神经网络 2
4.2目标特征分析与提取 2
4.3汉字分类识别 2
4.3.1 BP神经网络的搭建 2
4.3.2实验数据描述 2
4.4实验结果与数据分析 2
4.5本章小结 2
第五章 总结与展望 2
5.1总结 2
5.2展望 2
致谢 2
参考文献 2
附录一: 汉字识别部分代码 2
附录二: 英文文献翻译 41
第一章 绪论
1.1手写汉字识别研究的背景及意义
随着计算机科学技术的不断发展,特别是机器视觉和模式识别等技术的发展,目标识别技术已经引起了学术界、企业界、政府部分等高度这重视,并且取得了很多相应的成果。目标识别技术具有极其广阔的应用前景,它将会为世界带来巨大的社会效益和经济效益[1] 。
如今伴随平板、智能手机的普及,手写输入的应用极大地降低了广大老百姓的使用门槛,人们无需学习拼音、五笔字型,只要会写字,就可以熟练地在手机上输入汉字。在金融领域,各类自助设备应用越来越广泛,许多原本需要人工操作的业务,都搬到自助设备上实现,比如交易预填单系统,由客户在预填单机上预先将交易要素录入进电脑。此时,这些自助设备上的汉字录入将成为自助应用推广的瓶颈之一,手写汉字输入成了解决这个问题的最好选择。
1.1.1模式识别技术
模式识别技术(Pattern Recognition Technology)是指通过计算机技术用数学的方法对各种形式的信息进行处理和分析,以对事物进行描述、辨认、分类和识别的过程[2] 。它是信息科学和人工智能的重要组成部分,主要应用领域有[3]:图像处理、语音识别和数据挖掘等学科领域。
模式识别技术主要分为两大领域:基于决策理论方法的识别和基于结构方法的识别。其中,基于决策理论方法的识别处理的是使用定量的特征来描述的各类模式,如长度、面积、文理和灰度等。基于结构方法的识别处理的是由定性的特征来描述的各类模式,如形状数和串等。
模式识别从20世纪20年代发展到现在,模式识别在文字识别、语音识别、指纹识别和数据挖掘等方面的实际应用取得了巨大的成果,如手机、平板上的手写输入识别,苹果、谷歌的语音识别和谷歌、百度的搜索等。同时,人们认识到不存在能够处理所有模式识别问题的单一模型和解决所有识别问题的单一技术,我们所要做的就是结合具体的问题,把基于决策理论的方法和基于结构的方法结合起来。深入掌握各种工具的效能和应用,互相取长补短,使模式识别的发展更上一层。
1.1.2手写汉字识别
汉字拥有数千年的历史,是世界上使用人数最多的文字。但是汉字是一种象形文字,无法像字母组成的文字那样直接方便的输入到计算机,因此汉字输入的问题是人机交互的重要方面,也是中国人使用计算机的一大难题。
手写汉字识别(Handwritten Chinese Character Recognition,简称HCCR)属于模式识别领域,主要分为联机手写汉字识别和脱机手写汉字识别[4]。其中,联机手写汉字手写识别是对书写者的输入轨迹进行实时的采样,获取输入轨迹的坐标序列来进行识别的方法。而脱机识别是对书写好的汉字进行扫描生成图像来进行识别。对于联机手写汉字识别又有两种识别方法,一是统计识别方法,一是结构识别方法,其中统计识别方法是将输入轨迹作为一个整体,对整体进行统计各种特征,把这些特征作为识别对象进行识别[5]。结构识别方法是把汉字分解为一个个简单的基元,即汉字的基本笔划,通过对笔划的组合关系和顺序进行识别。
1.2国内外研究现状
汉字识别最早可以追溯到本世纪六十年代,从那时起人们开始了对印刷体汉字识别的研究。联机手写汉字识别主要开始于1966年,麻省理工学院的J.Liu提出了一种以笔划为基元的联机手写汉字识别方法[6]。该方法首先提取组成汉字的笔划段,然后用串匹配的方法对笔划的组成进行识别,但是对笔顺的要求比较高,也无法处理连笔的问题。在此之后,联机手写汉字识别技术开始成为研究的热点,并伴随着计算机技术的快速发展以及模式识别领域理论不断成熟和方法的不断深入和完善,到了本世纪八十年代后期,联机手写字符识别的技术已经朝着实用的方向发展。1981年,IBM公司E.F.Yhap等推出了第一套较为成熟的联机手写汉字识别系统,该系统是基于汉字的笔划和字根编码进行识别的,在系统中每个汉字用72这种字根拼成,而每个汉字又可以分解为42种笔划的组合,通过对笔划和字根的判定识别输入的汉字,当时对920个汉字的实验结果的正确率为91.1%,对2260个汉字测试的正确率为79.9%,在最近几年中, Microsoft、Google和Apple等科技巨头公司均投资于该方向的研究[6]。
国内关于手写汉字识别的研究一直处在一个平稳上升的阶段。从本世纪七十年代到八十年代,国内的研究人员提出了适用于汉字识别的各种方法,如特征点方法、汉字周边特征方法和汉字的结构特征方法等方法,并且在这些方法的基础上成功的设计了一些汉字识别系统,其中比较突出的有清华大学的清华多字体印刷汉字识别系统,沈阳自动化研究所的沈阳印刷汉字识别系统和北京信息工程学院的北信单体印刷汉字识别系统[7]。从八十年代起汉字OCR的研究一直受到国家“863计划”的资助,从而在此期间获得了许多重大的研究成果,其中最为突出的代表是中科院自动化研究所的汉王笔。1988年,刘迎建等人提出了以笔段为基元的联机手写汉字识别技术,该方法吧汉字分为笔段、笔划、字根、单字和词组等五个层次,分别用模糊属性文法进行描述,以启发式模板引导匹配。该设备可以识别12000个手写正楷汉字,没有笔顺限制,并且少数常用的字可以练笔书写,常用字的识别率达到90%以上[8]。从九十年代初期开始,国内汉字OCR技术进入了一个重要的阶段,前期实验室的研究成果开始转向应用,推向市场。同时一些手写汉字识别系统也开始向应用化的方向发展。
与此同时,台湾蒙恬公司开发的蒙恬笔for Palm/ for WinCE不仅拥有超强的识别能力,还提供了友好的人机交互界面。清华大学的清华紫光、北京大学的北大方正等研发的手写汉字识别系统的问世,使得联机手写汉字识别的研究是产品市场出现了前所未有的活跃现象。
1.3手写汉字识别的应用前景
手写汉字识别是近几年来研究人工智能和模式识别领域的热门课题,它有着重大的理论意义和应用前景。其中主要包括移动设备的汉字输入、各类自助设备的汉字输入等方面。
目前,随着平板和智能手机的普及,在Android和IOS设备上的手写输入已经相当的成熟。但是普通的笔记本没有触摸输入设备,并且外接手写板不是很便捷,大多数人依旧选择传统的键盘进行输入。但是,随着Windows8操作系统的诞生,触摸屏开始在笔记本上普及,手写汉字识别技术可以使笔记本的使用难度降低。
如今,各类自助设备应用越来越广泛,许多原本需要人工操作的业务,都搬到自助设备上实现,比如交易预填单系统,由客户在预填单机上预先将交易要素录入进电脑。此时,这些自助设备上的汉字录入将成为自助应用推广的瓶颈之一,手写输入成了解决这个问题的最好选择。
1.4本文研究内容和章节安排
联机手写输入软件的设计与实现所涉及的关键技术主要包括:输入轨迹的提取、汉字图像的预处理、汉字的特征提取和基于神经网络的分类识别。本文针对手写汉字识别的各个模块进行了相关的研究与实现。
首先,利用鼠标的回调函数获取输入轨迹的坐标,并通过对轨迹进行处理的方法将孤点滤除,然后将轨迹映射成二值图像。接下来采用开操作与闭操作等形态学处理方法消除汉字边缘的凸起和和填补字体笔划的狭小断裂。再利用几何变换对书写倾斜的汉字进行方向矫正,采用线性归一化,在保证图像的重心和汉字结构不变的前提下将特征区域映射到规定大小的模板中。最后,将归一化后的特征图像进行格式转换,将图像转换为一维的特征向量。
然后,根据BP神经网络的训练规则、每个样本的特征数目和模式类的数量搭建一个BP神经网络。
最后,根据每个模式类的部分样本对网络进行训练,再利用剩余的部分样本对训练好的网络进行测试。根据测试结果对网络隐藏层的神经元的数目进行修改,获取最佳识别效果。
本文各章节具体安排如下:
第一章主要介绍了模式识别的基本概念和本课题研究的背景及意义,国内外手写汉字识别的研究现状,手写汉字识别的应用前景。最后阐述了本课题的主要研究内容和文章组织结构。
第二章介绍了手写汉字识别的系统目标、系统模块组成、识别算法选择以及系统的设计流程。
本人签名: 日期: 摘 要
伴随着平板电脑和智能手机的普及,手写输入的应用为使用者提供了极大地方便。在金融等领域,很多服务开始转向自助设备,但是这些自助设备大都采用Windows操作系统,系统本身没有或仅提供简单的手写输入功能。此时,汉字录入将成为自助设备推广的瓶颈之一,手写汉字识别成了解决这个问题的最好选择。
本课题针对以上问题,在Windows环境下,采用C#和C语言编程,设计了基于BP神经网络的联机手写输入的人机交互界面和识别算法。具体工作如下:
1、 分析手写汉字识别的研究现状和以及本课题研究背景。
2、 确定系统设计目标、模块组成、算法选择和设计流程。
3、 编写人机交互界面,获取输入轨迹,对轨迹进行孤点消除并映射成二值化图像。
4、 采用形态学操作对汉字进行笔迹平滑,仿射变换进行方向矫正,线性归一化进行特征区域提取和归一化。
5、 获取特征区域的灰度特征,根据每个特征向量的特征数目和模式类数量,搭建BP神经网络,利用样本对神经网络进行训练和测试。
本课题通过大量样本对系统进行测试和参数修正,最终结果证明系统对手写汉字识别具有较好的识别效果。
查看完整论文请+Q: 351916072
关键字:汉字识别;统计方法;特征提取;BP神经网络
目录
摘 要 II
ABSTRACT II
目录 II
第一章 绪论 2
1.1手写汉字识别研究的背景及意义 2
1.1.1模式识别技术 2
1.1.2手写汉字识别 2
1.2国内外研究现状 2
1.3手写汉字识别的应用前景 2
1.4本文研究内容和章节安排 2
第二章 手写汉字识别系统方案设计 2
2.1系统设计目标 2
2.2汉字识别算法选择 2
2.2.1基于结构方法的汉字识别 2
2.2.2基于统计方法的汉字识别 2
2.2.3识别算法比较与分析 2
2.3系统模块组成 2
2.3.1轨迹提取模块 2
2.3.2预处理模块 2
2.3.3分类与识别模块 2
2.4本章小结 2
第三章 汉字识别预处理 2
3.1输入轨迹提取 2
3.2孤点消除 2
3.3笔迹平滑 2
3.3.1膨胀 2
3.3.2腐蚀 2
3.3.3开操作与闭操作 2
3.3.4形态学操作结果 2
3.4图像几何变换 2
3.5图像线性归一化 2
3.6本章小结 2
第四章 基于神经网络的汉字识别 2
4.1神经网络基本原理 2
4.1.1神经网络的最基本形式 2
4.1.2神经网络的训练算法 2
4.1.3 BP神经网络 2
4.2目标特征分析与提取 2
4.3汉字分类识别 2
4.3.1 BP神经网络的搭建 2
4.3.2实验数据描述 2
4.4实验结果与数据分析 2
4.5本章小结 2
第五章 总结与展望 2
5.1总结 2
5.2展望 2
致谢 2
参考文献 2
附录一: 汉字识别部分代码 2
附录二: 英文文献翻译 41
第一章 绪论
1.1手写汉字识别研究的背景及意义
随着计算机科学技术的不断发展,特别是机器视觉和模式识别等技术的发展,目标识别技术已经引起了学术界、企业界、政府部分等高度这重视,并且取得了很多相应的成果。目标识别技术具有极其广阔的应用前景,它将会为世界带来巨大的社会效益和经济效益[1] 。
如今伴随平板、智能手机的普及,手写输入的应用极大地降低了广大老百姓的使用门槛,人们无需学习拼音、五笔字型,只要会写字,就可以熟练地在手机上输入汉字。在金融领域,各类自助设备应用越来越广泛,许多原本需要人工操作的业务,都搬到自助设备上实现,比如交易预填单系统,由客户在预填单机上预先将交易要素录入进电脑。此时,这些自助设备上的汉字录入将成为自助应用推广的瓶颈之一,手写汉字输入成了解决这个问题的最好选择。
1.1.1模式识别技术
模式识别技术(Pattern Recognition Technology)是指通过计算机技术用数学的方法对各种形式的信息进行处理和分析,以对事物进行描述、辨认、分类和识别的过程[2] 。它是信息科学和人工智能的重要组成部分,主要应用领域有[3]:图像处理、语音识别和数据挖掘等学科领域。
模式识别技术主要分为两大领域:基于决策理论方法的识别和基于结构方法的识别。其中,基于决策理论方法的识别处理的是使用定量的特征来描述的各类模式,如长度、面积、文理和灰度等。基于结构方法的识别处理的是由定性的特征来描述的各类模式,如形状数和串等。
模式识别从20世纪20年代发展到现在,模式识别在文字识别、语音识别、指纹识别和数据挖掘等方面的实际应用取得了巨大的成果,如手机、平板上的手写输入识别,苹果、谷歌的语音识别和谷歌、百度的搜索等。同时,人们认识到不存在能够处理所有模式识别问题的单一模型和解决所有识别问题的单一技术,我们所要做的就是结合具体的问题,把基于决策理论的方法和基于结构的方法结合起来。深入掌握各种工具的效能和应用,互相取长补短,使模式识别的发展更上一层。
1.1.2手写汉字识别
汉字拥有数千年的历史,是世界上使用人数最多的文字。但是汉字是一种象形文字,无法像字母组成的文字那样直接方便的输入到计算机,因此汉字输入的问题是人机交互的重要方面,也是中国人使用计算机的一大难题。
手写汉字识别(Handwritten Chinese Character Recognition,简称HCCR)属于模式识别领域,主要分为联机手写汉字识别和脱机手写汉字识别[4]。其中,联机手写汉字手写识别是对书写者的输入轨迹进行实时的采样,获取输入轨迹的坐标序列来进行识别的方法。而脱机识别是对书写好的汉字进行扫描生成图像来进行识别。对于联机手写汉字识别又有两种识别方法,一是统计识别方法,一是结构识别方法,其中统计识别方法是将输入轨迹作为一个整体,对整体进行统计各种特征,把这些特征作为识别对象进行识别[5]。结构识别方法是把汉字分解为一个个简单的基元,即汉字的基本笔划,通过对笔划的组合关系和顺序进行识别。
1.2国内外研究现状
汉字识别最早可以追溯到本世纪六十年代,从那时起人们开始了对印刷体汉字识别的研究。联机手写汉字识别主要开始于1966年,麻省理工学院的J.Liu提出了一种以笔划为基元的联机手写汉字识别方法[6]。该方法首先提取组成汉字的笔划段,然后用串匹配的方法对笔划的组成进行识别,但是对笔顺的要求比较高,也无法处理连笔的问题。在此之后,联机手写汉字识别技术开始成为研究的热点,并伴随着计算机技术的快速发展以及模式识别领域理论不断成熟和方法的不断深入和完善,到了本世纪八十年代后期,联机手写字符识别的技术已经朝着实用的方向发展。1981年,IBM公司E.F.Yhap等推出了第一套较为成熟的联机手写汉字识别系统,该系统是基于汉字的笔划和字根编码进行识别的,在系统中每个汉字用72这种字根拼成,而每个汉字又可以分解为42种笔划的组合,通过对笔划和字根的判定识别输入的汉字,当时对920个汉字的实验结果的正确率为91.1%,对2260个汉字测试的正确率为79.9%,在最近几年中, Microsoft、Google和Apple等科技巨头公司均投资于该方向的研究[6]。
国内关于手写汉字识别的研究一直处在一个平稳上升的阶段。从本世纪七十年代到八十年代,国内的研究人员提出了适用于汉字识别的各种方法,如特征点方法、汉字周边特征方法和汉字的结构特征方法等方法,并且在这些方法的基础上成功的设计了一些汉字识别系统,其中比较突出的有清华大学的清华多字体印刷汉字识别系统,沈阳自动化研究所的沈阳印刷汉字识别系统和北京信息工程学院的北信单体印刷汉字识别系统[7]。从八十年代起汉字OCR的研究一直受到国家“863计划”的资助,从而在此期间获得了许多重大的研究成果,其中最为突出的代表是中科院自动化研究所的汉王笔。1988年,刘迎建等人提出了以笔段为基元的联机手写汉字识别技术,该方法吧汉字分为笔段、笔划、字根、单字和词组等五个层次,分别用模糊属性文法进行描述,以启发式模板引导匹配。该设备可以识别12000个手写正楷汉字,没有笔顺限制,并且少数常用的字可以练笔书写,常用字的识别率达到90%以上[8]。从九十年代初期开始,国内汉字OCR技术进入了一个重要的阶段,前期实验室的研究成果开始转向应用,推向市场。同时一些手写汉字识别系统也开始向应用化的方向发展。
与此同时,台湾蒙恬公司开发的蒙恬笔for Palm/ for WinCE不仅拥有超强的识别能力,还提供了友好的人机交互界面。清华大学的清华紫光、北京大学的北大方正等研发的手写汉字识别系统的问世,使得联机手写汉字识别的研究是产品市场出现了前所未有的活跃现象。
1.3手写汉字识别的应用前景
手写汉字识别是近几年来研究人工智能和模式识别领域的热门课题,它有着重大的理论意义和应用前景。其中主要包括移动设备的汉字输入、各类自助设备的汉字输入等方面。
目前,随着平板和智能手机的普及,在Android和IOS设备上的手写输入已经相当的成熟。但是普通的笔记本没有触摸输入设备,并且外接手写板不是很便捷,大多数人依旧选择传统的键盘进行输入。但是,随着Windows8操作系统的诞生,触摸屏开始在笔记本上普及,手写汉字识别技术可以使笔记本的使用难度降低。
如今,各类自助设备应用越来越广泛,许多原本需要人工操作的业务,都搬到自助设备上实现,比如交易预填单系统,由客户在预填单机上预先将交易要素录入进电脑。此时,这些自助设备上的汉字录入将成为自助应用推广的瓶颈之一,手写输入成了解决这个问题的最好选择。
1.4本文研究内容和章节安排
联机手写输入软件的设计与实现所涉及的关键技术主要包括:输入轨迹的提取、汉字图像的预处理、汉字的特征提取和基于神经网络的分类识别。本文针对手写汉字识别的各个模块进行了相关的研究与实现。
首先,利用鼠标的回调函数获取输入轨迹的坐标,并通过对轨迹进行处理的方法将孤点滤除,然后将轨迹映射成二值图像。接下来采用开操作与闭操作等形态学处理方法消除汉字边缘的凸起和和填补字体笔划的狭小断裂。再利用几何变换对书写倾斜的汉字进行方向矫正,采用线性归一化,在保证图像的重心和汉字结构不变的前提下将特征区域映射到规定大小的模板中。最后,将归一化后的特征图像进行格式转换,将图像转换为一维的特征向量。
然后,根据BP神经网络的训练规则、每个样本的特征数目和模式类的数量搭建一个BP神经网络。
最后,根据每个模式类的部分样本对网络进行训练,再利用剩余的部分样本对训练好的网络进行测试。根据测试结果对网络隐藏层的神经元的数目进行修改,获取最佳识别效果。
本文各章节具体安排如下:
第一章主要介绍了模式识别的基本概念和本课题研究的背景及意义,国内外手写汉字识别的研究现状,手写汉字识别的应用前景。最后阐述了本课题的主要研究内容和文章组织结构。
第二章介绍了手写汉字识别的系统目标、系统模块组成、识别算法选择以及系统的设计流程。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/txgc/2286.html