成都道成设备工程有限责任公司主要展示成都机器视觉设备,字符检测设备,三维视觉测量设备等方面的相关信息以及资讯发布,欢迎您关注我站!

028-62659003 17358678075

新闻类别

联系我们/CONTACT US

企业名称:成都道成设备工程有限责任公司

联系:王经理

手机: 17358678075

邮箱: 2769688132@qq.com

网址: www.cddcee.com

地址: 成都市武侯区长益路13号蓝海office A座 503室

热点资讯

字符检测设备好用吗?都针对什么进行识别?

来源:http://www.cddcee.com/news690827.html   发布时间:2021-09-26 17:26:00

最近在一个爬虫项目中遇到了考证码,需求机器自动辨认绕过。刚好与题主的问题相似,在这里做一些分享。


在网上调研了材料和文献后,分别采用OCR辨认和模板库匹配办法对不同类型考证码停止了辨认。主要过程能够合成为三个步骤:1.图片清算,2.字符切分,3.字符辨认。以下分离工作经历和调研内容解说一些常用的考证码辨认办法和过程。

字符检测设备好用吗?都针对什么进行识别?

1.图片清算


图片清算是为接下来的机器学习或模板匹配阶段做准备的,指经过灰度化、二值化、干扰点清算等过程,得到比拟洁净的图片数据,详细样例见下表。


1.1 彩色去噪

在计算机中运用最多的 RGB颜色空间,分别对应红、绿、蓝三种颜色,经过分配三个重量的比例来组成各种颜色。以最常见的32位颜色为例,一个重量是用8位来表示,最大值是255,灰度图是指组成颜色的三个重量相等。原始彩色图片包含的信息量是最大的,假如考证码图片中有一些应用颜色反差加的干扰点或者线条,最好能在该阶段做初步清算。比拟简单的一种处置办法是采用3*3矩阵对图像停止平滑处置,即对每个像素取他所在3*3矩阵一切点的RGB均值,分别作为新的RGB值。略微做点优化,取3*3矩阵中RGB三维欧式间隔最接近均值的点作为新值。


1.2 灰度化

在彩色电视机系统中,通常运用一种叫 YUV 的颜色空间,其中Y表示亮度信号,关于人眼来说,亮度信号(Y)是最敏感的,假如将彩色图像转换为灰度图像,仅仅需求转换并保管亮度信号就能够。从RGB到YUV空间的Y转换有一个很著名的心理学公式:Y = 0.299R + 0.587G + 0.114B。


而实践应用时,将系数缩放1000倍来完成整数运算:Gray = (R*299 + G*587 + B*114 + 500) / 1000 。留意后面那个除法是整数除法,所以需求加上500来完成四舍五入。该公式的另一个简化变种也很盛行:Gray = (R*30 + G*59 + B*11 + 50) / 100。更快的算法是采用移位替代除法,所以能够将系数缩放成 2的整数幂,再做右移操作。该整数取7从精度和速度上最适宜:Gray = (R*0.299*2^7 + G*0.587*2^7 + B*0.114*2^7)>>7 = (R*38 + G*75 + B*15)>>7


1.3 二值化

为了简化接下来的计算,需求把灰度图片转化成黑白二值图。默许状况下值大于127的像素点被设置为白色,其他像素点设置为黑色。当然,这个阈值也需求依据图片的实践状况计算调整。普通采用直方图统计肯定动态阈值的办法比拟靠谱,白底黑字的取直方图靠左边的波谷位置作为阈值,黑底白字则取直方图右边的波谷位置作为阈值,将背景和字符作很好的辨别。

相关标签:字符检测设备,