18

超轻量级中文OCR,支持竖排文字识别、ncnn推理,总模型仅17M

 4 years ago
source link: https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/104889907
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

ZzeyeeU.jpg!web

zAzeIzb.jpg!web

整理 | AI科技大本营

光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题App用来识别书本上的试题。

近期,这 个叫做chineseocr_lite的OCR项目开源了,这是一个超轻量级中文ocr,支持竖排文字识别,支持 ncnn 推理,ps enet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅17M。

目前,这个开源项目已在GitHub上标星2400+。

这个项目基于chineseocr与psenet实现中文自然场景文字检测及识 别,环境是linux/macos。

以下为可实现的功能:

  • 提供轻量的 backone 检测模型 psenet(8.5M),crnn_lstm_lite (9.5M) 和行文本方向分类网络(1.5M)

  • 任意方向文字检测,识别时判断行文本方向

  • crnn\crnn_lite lstm\dense识别(ocr-dense和ocr-lstm是搬运chineseocr 的)

  • 支持竖排文本识别

  • ncnn实现psenet(未实现核扩展)

  • ncnn实现crnn_dense(改变了全连接为conv1x1)

  • ncnn实现shuuflenev2角度分类网络

  • ncnn实现ocr整个流程

最近,项目作者对更新了可实现的功能。

  • nihui大佬实现的 crnn_lstm推理

  • 升级crnn_lite_lstm_dw.pth模型crnn_lite_lstm_dw_v2.pth , 精度更高

  • 提供竖排文字样例以及字体库(旋转90度的字体)

字体样式

3iYZZzf.jpg!web

生成的竖排文本样例

fIre6nM.jpg!web

识别效果展示:

uQJjQ3F.jpg!web

ncnn检测识别展示(x86 cpu 单进程)

7R7neyf.jpg!web

项目地址: https://github.com/ouyanghuiyu/chineseocr_lite

【end】

原力计划

《原力计划【第二季】- 学习力挑战》正式开始!即日起至 3月21日,千万流量支持原创作者!更有专属【勋章】等你来挑战

V3M7BzI.jpg!web


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK