印刷体汉字识别技术研究

印刷体汉字识别技术研究[20191215142841]
摘 要
当今社会越来越趋向于信息化,在信息处理,邮政及金融系统,办公自动化还有在五千年历史中留下的很多宝贵的文献资料都需要用到文字识别技术,有着广泛的应用前景,所以我们必须不断发展印刷体汉字识别技术。实现大量的中文信息能更快速的输入进计算机,方便对其进行进一步的处理。
第一章绪论先给出了研究印刷体汉字识别技术的作用、发展进程、难点;接着第二章介绍了汉字识别的原理和一般流程;第三章把每个模块功能如预处理,汉字特征提取,汉字的分类识别,后处理等每个模块做了描述;第四章然后运用MATLAB对此系统设计和分析;第五章最后又对汉字识别技术进行了展望及总结。这样通过对印刷体理论介绍和分析演示可以让读者对印刷体汉字识别系统有一定的了解及深刻的认识。通过对标准图像的设计分析,当把输入的图像转灰度,平滑去噪,标准二值化,行列切割后识别输出。接着读取乱序图像,在经过和标准图像一样的预处理过程后进行特征提取及匹配识别。希望印刷体汉字识别系统可以百分之百识别出乱序图像中的汉字,达到我们预期想要得到的结果。从识别结果获得此印刷体汉字识别系统利用已建立的标准库,将后面的输入图像通过特征匹配识别输出来。通过对相似字的标准和乱序图像设计分析,希望此系统也能很好的识别相似字,从而确定此系统优越的识别率。
通过一般字和相似字识别比较,标准图像和乱序图像识别比较,本印刷体汉字识别系统可以把实验用到的汉字百分之百的识别,拥有比较高的识别率。根据本印刷体汉字识别系统可以识别车牌号上31个省的简称,对车牌里面的汉字扫描识别出车子是属于哪个省的。对中文大写数字的识别可以应用到银行、单位和个人等的各种票据和结算凭证上,把它们识别出来录入进电脑,减少了人为地工作量。
 查看完整论文请+Q: 351916072 
关键字:扫描;预处理;特征提取;匹配识别;BP神经网络;MATLAB识别

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/txgc/2228.html

好棒文