tag 标签: 字符识别

相关博文
  • 热度 16
    2013-8-8 21:16
    1683 次阅读|
    2 个评论
    输入:来自彩票机的实时视频图像 输出:提取每期开票的号码 演示视频如下: http://v.youku.com/v_show/id_XNTkwMDIzMjA4.html http://www.tudou.com/programs/view/Dyi6M4QVVSM/     提取的单个图像:     进行轮廓提取后的图像      
  • 热度 23
    2012-11-19 10:10
    1697 次阅读|
    5 个评论
    字符识别是一个有趣的问题,你在写字板上写下需要识别的字符,然后就是算法大显身手了,这里的主要办法在于模板的匹配,其实很多的算法都是基于这样的一种方法,而且这种方法在大多数情况下是十分实用的,当然如果你编程实现过类似的算法或者是功能,你可能会说这种办法不是那么的给力,不是那么的有效,常常会出错,是的,的确是的。 但是还有一点,就是我在最近发现的,其实就算是模板的匹配这种方法,其模板的选择也是很有讲究的,不是简单的选取,当然,不反对简单的选取,但是这样子的效果确实不怎么样,所以就算是模板,也需要认真的考虑,怎样的模板才是最好的呢?就我看来,最好的模板有一定的适应能力,而不是一个“偏执狂”,在一般的意义上的模板,也就是我之前编程匹配的时候使用的那种,是对于位置极其敏感的,这种模板有它自己的好处,那就是对于十分标准的输入,它可以做到几乎不出错的判断,这正是我们所需要的,但是,别忘了,这是在十分标准的输入的情况下,在手写这种情况下,怎么办呢?没有办法,几乎全是错误,那叫一个惨不忍睹啊。所以,你制作模板的时候用的是标准的字符,而你给出识别的内容时,却是完全变了样子的东西,你说你是不是特别不够意思呢? 所以,在以前我并没有意识到这个问题,还一味苛求二进制的大脑进行复杂的多维的复杂思考,真是有点不靠谱,好在前两天网上看到一个办法,也是模板匹配,突然觉得很有意思,试了一下,效果还真的很不错! 所以说,很多的时候,不是程序写的有问题,是写的很有问题,根本的不去改变,那就啥也改变不了。 好了,废话不多说了,上方法吧,我的测试环境你可能没有听说过,不过没关系,就是java语言,只要有算法,走到哪里都不怕,这句话真是越来越有感触了。 这次的模板是基于一种统计的办法做出来的,也不能说和位置没有关系,在模板匹配这种方法中,和位置无关这句话基本就是扯淡。至少个人感觉是如此。 好了,这里主要的就是描述一下这种算法,至于具体的代码,就不是难事了,在一幅存在字符的图片中,我们现在讲的是只有一个字符的图片中,当然,有很多的字符也是可以的,只不过在分割的时候比较的痛苦,也不是难事,其实就是一些循环语句上的判断,然后进行一些数学的运算,然后给出边界,然后进行分别的识别,这里讲的是一个字符,首先是定出这个字符的边界,便于精细的处理,这个边界非常重要,如果没有这个边界,很多的噪声是会产生出来影响的,所以这一步必不可少。 其次是进行画方格,画方格干啥呢?主要是为了后面的分片的统计,写到这里有些读者应该明白我后面要干啥了,这里分的是5×5的方格,其实可以更加的精细,但是并不建议去画超过9×9的方格,因为我们的字符的区域毕竟是有限的,而且这样子也是需要一定的程序运行的时间的,而且模板的规模和所需的存储的空间也会随之增大,所以这样看来,5×5的确是可以了,有一点需要提前声明,我给的这个模板的方法不是能够达到100%的正确的识别率的,所以如果你所要求的是万无一失,我建议你就不用在往下看了,之前的时间的浪费很不好意思。 好了,分好了空间,我们开始进行统计,对于每一块方格,其中有很多的点,就是像素点,首先你需要能够读取到图像的确定的一个位置的像素值,也就是颜色,这之前最好进行一下图像的二值化处理,而由于这里是用于手写识别,所以提供的背景为白色,然后写的字就是黑色的,所以比较的好处理,就相当于直接得到的就是二值化的图像了,何为二值化,不就是图像中存在的像素点只有两种吗?恩,如果你的应用环境有类似的情景,比如只有黄色和红色,那么也不用处理,然后我们统计在每一个方块中出现的字符的对应的颜色值的数量,在我这里,就是黑点的数量,然后这个数量和这个方块中的总的点的数量有一个比值,我们把这个比值记录下来,这样子,对所有的25个方块进行统计,然后把这些数据存在程序中的一个数组中,好了,大部分的工作都完成了,下面进行识别啦!激动人心和见证奇迹的一刻终于到来了!  
相关资源
  • 所需E币: 2
    时间: 2022-1-5 23:55
    大小: 197.96KB
    上传者: czd886
    基于FPGA高速字符识别的算法分析与应用
  • 所需E币: 0
    时间: 2021-3-9 09:57
    大小: 2.29MB
    上传者: czd886
    基于单片机的手持式字符识别仪研制
  • 所需E币: 0
    时间: 2020-12-22 23:29
    大小: 1.13MB
    上传者: czd886
    基于ARM Cortex-A9字符识别系统设计
  • 所需E币: 3
    时间: 2019-12-25 15:04
    大小: 5.91MB
    上传者: 二不过三
    识别模式——道路识别,高维数据分析,字符识别,人脸特征识别……
  • 所需E币: 3
    时间: 2019-6-3 20:55
    大小: 1.84MB
    上传者: royalark_912907664
    在财务领域,纸质报表向电子报表的转换需要大量的人工和时间成本。本文探究了纸质财务报表的自动识别过程,通过预处理、表头和表格区域的分割提取、单元格分割、字符提取与识别、表格还原等过程实现报表图片的转换,在实现报表信息便捷存储和查询的同时,也克服了人工录入的低效率、高成本等缺点。实验结果表明,该算法能有效实现图像的倾斜校正,且无需设置提示框限定拍摄范围;能有效分割表格格式的字符,其准确率为99.3%,无需手动框选待识别字符;字符识别准确率为93.7%,其中数字识别的准确率为97.8%,总体字符识别准确率相较Tesseract提升了8.1%。
  • 所需E币: 3
    时间: 2019-6-2 22:53
    大小: 1.62MB
    上传者: royalark_912907664
    针对智能交通系统中的车牌图像识别问题,提出了一种在形状上下文特征提取算法的前提下,基于多种现有度量算法相结合的联合度量策略的图像识别机制。首先,描述了基于形状上下文的车牌图像的特征提取过程;其次,在分析现行图像识别方法的基础上,提出了基于经典的欧式距离度量算法和TPS薄板样条法进行的联合度量策略的总体思路;而后讨论了基于联合度量策略机制的识别算法在字符识别中的可行性及识别精度,其识别率达到90.3%,并具备较高的稳定性;最后,将该算法应用在实际的车牌图像的识别系统中,车牌图像识别率达到86%,单个字符的识别率达到97.7%,实验结果表明所提出的方法是有效的。