两个必要的数据集:
- 文字识别,model.h5
- 图片识别,12306.image.model.h5
识别器数据的下载地址:
https://pan.baidu.com/s/1OsBIBM4rl8EnpZt7VYiD9g
python main.py <img.jpg>
我把设计思路写在维基中了:https://github.com/zhaipro/easy12306/wiki
~$ python3 main.py 2.jpg
41 # 要找的东西是41
0 0 41 # 第一行第一列就是41
0 1 39
0 2 73
0 3 73
1 0 33
1 1 41
1 2 31 # 最后的这两个是同一种东西
1 3 31
具体的编号:https://gist.github.com/zhaipro/97d46ff244f66d17961a5f1ef17b6d8f
识别前所未见的图片
~$ python3 mlearn_for_image.py 8.jpg
[0.8991613] # 可信度
[0] # 0 表示的就是打字机
识别验证码(总之我开发页面的能力极弱)。
识别单个图片,可任意尺寸(总之由cv2简单的将其转为指定尺寸)。
源码很乱,整理中…