这个仓库仅完成了CascadeTabNet的推理部分,CascadeTabNet是一种用于端到端表格检测和结构识别的方法。它的原论文为CascadeTabNet: An approach for end-to-end table detection and structure recognition from image-based documents。你可以在原作者的GitHub仓库上找到源代码和更多细节。也可在这篇知乎找到更具体的实现原理。
- PyTorch = 1.5.1
- Python = 3.8 (在ubuntu18.04上测试)
- CUDA = 10.1
本仓库仅用于展示如何使用已经训练好的模型进行推理。如果你想进行训练、评估等其他操作,请查看原仓库中的详细文档。
你可以从以下链接下载示例模型权重文件:示例模型权重文件
由于版本兼容性问题,你需要在以下文件中将AT_CHECK
替换为TORCH_CHECK
:
mmdetection/mmdet/ops/dcn/deform_conv.py
mmdetection/mmdet/ops/dcn/deform_pool.py
mmdetection/mmdet/ops/roi_align/src/roi_align_cuda.cpp
mmdetection/mmdet/ops/nms/src/nms_cuda.cpp
mmdetection/mmdet/ops/roi_pool/src/roi_pool_cuda.cpp
mmdetection/mmdet/ops/masked_conv/src/masked_conv2d_cuda.cpp
mmdetection/mmdet/ops/carafe/src/carafe_cuda.cpp
mmdetection/mmdet/ops/carafe/src/carafe_naive_cuda.cpp
更多具体步骤请查看 demo.ipynb
。
使用模型对示例图片进行推理,以下是推理结果示例: