图片验证码的识别方法
对于不同难易程度的图片验证码,有不同的处理方式,比如“蛮力型”的通用识别方法和“特事特办”的特别识别方法。但是对于卷积神经网络来说,他们的区别只在于对样本的依赖度不同。理论上,只要给充足的带标记样本,神经网络都是有能力实现拟合。
“蛮力型”的通用识别方法
此类识别方法就是流程化作业,基本不太需要在编程上思考太多。
识别步骤如下:
下载一定数量的目标验证码图片,数量根据验证图片的复杂程度而定。
准备好一套标准的CNN图像分类的项目模板,并做好相关的功课。
对项目模板进行简单的参数调整,以适配当前问题的图片尺寸。
将图像输入CNN,对输出的结果和先验标记的类型做误差对比
不断迭代生成模型
由Google主推的深度学习框架tensorflow的入门文档里面就介绍了分别用矩阵回归和CNN神经网络对手写数字识别的方法。
当然,关于如何获取带标记的数据,目前也有比较便宜的获取渠道,直接在网上搜索“打码平台”后,可发现有许多提供 “人工智能”领域的“人工”打码服务的服务商,并且大部分都有明码标价。对于图片验证码,基本上是几分钱一张标记图。