点击选择文字验证码识别

文字点选、选字、选择文字验证码识别
特点
纯pytorch实现，无需安装其他复杂依赖
方式一识别速度约在200~300ms之间，使用GPU话会更快
方式二的话速度约为50ms

免责声明

本项目仅供学习交流使用，请勿用于非法用途，不得在任何商业使用，本人不承担任何法律责任。

训练集

百度网盘
链接：https://pan.baidu.com/s/1FF6A-YZAE1Bofgswp-D29w
提取码：ceow

实现逻辑

使用了约3000张左右的验证码进行训练
方式一通过率达到90%以上, 偶尔有些文字识别错了也没关系，依然能通过
方式二的话通过率不高，主要问题存在为语序预测不准确和直接识别文字不准，考虑解决方案为增加训练集
预测语序的kenlm模型训练集是2014年的人民日报,效果只能说一般，考虑更换训练集
识别逻辑
方式一
1、利用yolo框选出给出的文字和图中出现的文字，作为题目
2、利用crnn识别给定的文字，作为答题范围
3、根据答题范围，利用cnn预测图片中出现的文字是那个

方式二
1、利用yolo框选图中出现的文字
2、利用cnn识别图中文字
3、利用kenlm计算各种组合情况，选择困惑度最低的,获得正确的词语

模型文件

下载链接
http://39.108.219.137/text_select_captcha/model
百度网盘
链接：https://pan.baidu.com/s/1FF6A-YZAE1Bofgswp-D29w
提取码：ceow
（下载model文件夹放入到代码所在目录）
模型文件在model目录下
卷积神经网络模型 cnn_iter.pth（用于识别图片中的文字）
卷积神经网络+CTCloss模型 ocr-lstm.pth（用于识别标题中的文字）
yoloV3模型 yolov3_ckpt.pth （用于框选出图片中的文字和标题）
kenlm统计语言模型 people_chars_lm.klm （用于计算语序）
模型结构
模型结构存放在src/utils中

环境准备

1、安装python3.6（建议使用anconda）
2、建立虚拟环境
3、pip install -r requirements.txt

如何使用

方式一
python mode_one.py
方式二
python mode_two.py

结果如下

[
    {
        "crop": [
            231,
            173,
            297,
            248
        ],
        "classes": "target",
        "content": "拌"
    },
    {
        "crop": [
            0,
            344,
            114,
            385
        ],
        "classes": "title",
        "content": "凉拌牛肚"
    },
    {
        "crop": [
            58,
            189,
            125,
            265
        ],
        "classes": "target",
        "content": "牛"
    },
    {
        "crop": [
            231,
            271,
            297,
            343
        ],
        "classes": "target",
        "content": "肚"
    },
    {
        "crop": [
            201,
            79,
            265,
            152
        ],
        "classes": "target",
        "content": "凉"
    }
]

效果演示

以bilbil登录验证码为例
python bilbil.py

打赏

如果觉得我的项目对您有用，请随意打赏。您的支持将鼓励我继续创作！
o(￣︶￣)o

如有什么问题欢迎各位在lssues中提问
有其他问题或需求请联系邮件[email protected]

参考资料

https://github.com/ypwhs/captcha_break
https://github.com/eriklindernoren/PyTorch-YOLOv3
https://github.com/meijieru/crnn.pytorch
https://github.com/chineseocr/chineseocr
https://github.com/JiageWang/hand-writing-recognition

点个star再走呗！

2020/08/31 优化识别单字的卷积神经网络

2020/09/01提交识别准确率从75%提升到90%，目标检测模型从yolo-tiny替换成yolo

模型大小从50M增加到200M,大幅减少漏检测的情况，如果要使用yolo-tiny仅需要修改setting.py中相关路径

uotogk / text_select_captcha Goto Github PK

text_select_captcha's Introduction

点击选择文字验证码识别

免责声明

训练集

实现逻辑

模型文件

环境准备

如何使用

效果演示

打赏

参考资料

点个star再走呗！

2020/08/31 优化识别单字的卷积神经网络

2020/09/01提交识别准确率从75%提升到90%，目标检测模型从yolo-tiny替换成yolo

text_select_captcha's People

Contributors

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent

uotogk / text_select_captcha Goto Github PK

text_select_captcha's Introduction

点击选择文字验证码识别

免责声明

训练集

实现逻辑

模型文件

环境准备

如何使用

效果演示

打赏

参考资料

点个star再走呗！

2020/08/31 优化识别单字的卷积神经网络

2020/09/01提交 识别准确率从75%提升到90%，目标检测模型从yolo-tiny替换成yolo

text_select_captcha's People

Contributors

Recommend Projects

Recommend Topics

Recommend Org

2020/09/01提交识别准确率从75%提升到90%，目标检测模型从yolo-tiny替换成yolo