README.md

整体介绍

赛题介绍

我们的队名是:鹏脱单攻略队后面改为"天晨破晓" 最终我们团队成绩在复赛AB榜均排在第一名,识别准确率达0.996952

团队成绩:2019CCF-BDCI大赛最佳创新探索奖和 "基于OCR的身份证要素提取"单赛题冠军

系统处理流程图

方案亮点

我们采用条件生成对抗网络(CGAN)处理赛题中的水印干扰,取到了比较好的效果,展示一下效果图片:

生成仿真数据源码,生成仿真训练数据训练去水印模型和文字识别模型

系统方案介绍 (包含方案论文\答辩PPT)

执行方式介绍

完整执行示例:
CPU执行,单进程:
python main_process.py --test_experiment_name test_example --test_data_dir ./test_data --gan_ids -1 --pool_num 0
参数详解:
--test_experiment_name:实验名,将决定中间数据结果存放目录
--test_data_dir: 数据目录
--gan_ids: 去水印模型:如果是-1 则是cpu运行, 大于0,则是GPU
--pool_num 0单进程 大于0多进程
其他参数参考main_process.py中的help

项目整体文件结构说明:

(按照处理流程介绍,具体文件介绍见文件内的readme)

身份证区域提取模块 cut_twist_process

剪切、翻转部分代码；用于将身份证正反面从原始图片中切分出来

去除水印\关键文本定位模块 watermask_remover_and_split_data

进行水印去除,身份证切割,提取文字部分,滤波

去水印模型 pytorch-CycleGAN-and-pix2pix

我们训练好的去除水印模型地址:

参考资料

去水印模型采用条件gan网络。论文链接

参考了GitHub上gan pix2pix 项目，链接,我们基于此项目进行了一些更改

文字识别模块 recognize_process

用于识别图片中的文字信息

参考资料

识别模型采用CRNN。论文链接

参考了GitHub上两个模型的TensorFlow实现

项目1

项目2

文本纠正模块 data_correction_and_generate_csv_file

对识别结果进行纠正,以及生成最终的csv文件

data_temp

CCFTestResultFixValidData_release.csv

生成的结果文件

main_process.py

执行脚本

Requirement.txt

运行的环境要求

注意

去水印模型地址

文字识别模型地址

这两项是工程的submodel,需要克隆的时候需要加上"--recursive"参数去水印模型较大,采用了git-lfs,要安装这个包,不然可能会导致clone失败或者比较慢

!!!注:测试数据跟初赛和复赛的数据格式需要保持一致,每面身份证左上角需要有:"仅限DBCI比赛(复赛)使用"字样, 且字体大小格式位置应该跟初赛和复赛的保持一致,否则将严重影响识别的准确性甚至代码运行出错原因:对于身份证各个元素的识别,我们是先裁剪出来,再识别的.我们在裁剪的时候,是以"限DBCI"为参考的 ,每次裁剪前,都会用模板在图片匹配对应的位置,得到参考坐标,再相对于这个参考坐标裁剪各个元素.

GitHub - Mingtzge/2019-CCF-BDCI-OCR-MCZJ-OCR-IdentificationIDElement: 2019CCF-BD...

README.md

整体介绍

系统处理流程图

方案亮点

执行方式介绍

项目整体文件结构说明:

身份证区域提取模块 cut_twist_process

去除水印\关键文本定位模块 watermask_remover_and_split_data

去水印模型 pytorch-CycleGAN-and-pix2pix

参考资料

文字识别模块 recognize_process

参考资料

文本纠正模块 data_correction_and_generate_csv_file

data_temp

CCFTestResultFixValidData_release.csv

main_process.py

Requirement.txt

注意

Recommend

GitHub - markbates/goth: Package goth provides a simple, clean, and idiomatic wa...

GitHub - xteve-project/xTeVe: M3U Proxy for Plex DVR and Emby Live TV

GitHub - Z3Prover/z3: The Z3 Theorem Prover

GitHub - vaib25vicky/awesome-mobile-security: An effort to build a single place...

GitHub - hakluke/hakrawler: Simple, fast web crawler designed for easy, quick di...

GitHub - dani-garcia/bitwarden_rs: Unofficial Bitwarden compatible server writte...

一文回顾2019年12月的隐私币动态你关心的XMR、Grin、Beam、ZEC都在这里

闲谈哈耶克、中本聪与比特币

C语言字符集

Samsung Galaxy S9 Finally Receives Stable Android 10 Update | Scoop Byte

About Joyk