.NET Core 调用百度 PaddleOCR 识别图文

了解 PaddleOCR 之前，首先了解一下 PaddlePaddle。飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础，是中国首个开源开放、技术领先、功能完备的产业级深度学习平台，集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体。目前，飞桨已凝聚超265万开发者，服务企业10万家，基于飞桨开源深度学习平台产生了34万个模型。飞桨助力开发者快速实现AI想法，快速上线AI业务。帮助越来越多的行业完成AI赋能，实现产业智能化升级。

官网：https://www.paddlepaddle.org.cn/

PaddleOCR 旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。

首先看效果图：

（识别后，标注的边框是自己根据返回的结果绘出来的）

百度飞桨需要的 Windows 环境

Windows 7/8/10 专业版/企业版 (64bit)
GPU版本支持CUDA 9.0/10.0/10.1/10.2/11.0，且仅支持单卡
Python 版本 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bit)
pip 版本 20.2.2+ (64 bit)

注意：使用高版本的 python，如：python 3.9 会报错如下：

ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle

解决方案：

下载支持的版本，例如：3.8.8 版本，下载地址：https://www.python.org/ftp/python/3.8.8/python-3.8.8-amd64.exe

python –version
pip –version
python -c “import platform;print(platform.architecture()[0]);print(platform.machine())”

需要确认Python和pip是64bit，并且处理器架构是x86_64（或称作x64、Intel 64、AMD64）架构，目前PaddlePaddle不支持arm64架构。下面的第一行输出的是”64bit”，第二行输出的是”x86_64”、”x64”或”AMD64”即可。

（不要执行）卸载命令：

python -m pip uninstall paddlepaddle

安装 paddlehub

命令：

pip install paddlehub –upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple

下载克隆 PaddleOCR

有条件的使用 git clone 命令下载，没条件的直接下载成压缩包再解压，地址：https://github.com/PaddlePaddle/PaddleOCR

我直接下载后，解压到：D:itsvsePaddleOCR-release-2.0 文件夹下面。

下载推理模型

安装服务模块前，需要准备推理模型并放到正确路径。

检测模型：https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_det_infer.tar
方向分类器：https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar
识别模型：https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_rec_infer.tar

我是下载后，放在了 D:itsvsePaddleOCR-release-2.0deploymodel 文件夹下面，如下图：

ModuleNotFoundError: No module named ‘imgaug’
ModuleNotFoundError: No module named ‘pyclipper’
ModuleNotFoundError: No module named ‘lmdb’

使用 pip 安装即可，例如：pip install imgaug

安装成功如下图：

[2021-03-15 15:59:37,549] [ INFO] – Successfully uninstalled ocr_system
[2021-03-15 15:59:38,237] [ INFO] – Successfully installed ocr_system-1.0.0

使用 python 客户端测试图片

将需要测试的图片放入 “D:itsvsePaddleOCR-release-2.0docimgs1” 文件夹内，在 D:itsvsePaddleOCR-release-2.0 执行如下命令：

由于我是用的是虚拟机部署的服务端，有时候会报内存的错误：

Fail to alloc memory of 268418688 size.

临时的解决方案，重新启动服务端。

参考资料：

https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.0/deploy/hubserving/readme.md
https://www.paddlepaddle.org.cn/install/quick

文章知识点与官方知识档案匹配，可进一步学习相关知识Python入门技能树首页概览210534 人正在系统学习中

来源：dotNET跨平台

声明：本站部分文章及图片转载于互联网，内容版权归原作者所有，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

.NET Core 调用百度 PaddleOCR 识别图文

相关推荐