-
运行:
- 进行识别时运行
python labReport.py
findLine.py
用于定位直线,不过这个方法效果不好,后期被放弃imageResize.py
用于改变图片尺寸,从opencv的方法里移植过来的,做了点小改变scanDouble.py
平时用来调试的文件,不用理transform.py
用于一张图片的四点定位,将化验单从照片中裁剪出来labReportBackup.py
用于备份代码
- 进行识别时运行
-
要求:
- 这张照片要横屏拍照,化验单正对,手机头部向左
- 保证化验单四个角都在照片内
- 照片要和背景对比明显一点好
- 基于python2.7
-
识别过程:
- 得到一张符合图像的照片,经过处理,得到一张裁剪出来的化验单
- 分析化验单图片,定位每个数据的像素框,分别裁剪出来
- 通过tesseract来进行识别
-
后期处理:
- 第一位有可能识别出非法字符,我直接舍弃
- 有可能把小数点.识别出上引号’,还有就是多识别出空格,我先把全部非数字转化为小数点,然后删除多余小数点
- 第一位0可能识别为o或者O,加个条件判断,转化过来
guoyalun / hostpital-test-ocr Goto Github PK
View Code? Open in Web Editor NEW化验单OCR 识别数据