基于PaddleOCR官方库修改的Serverless版本,实用的超轻量级OCR系统,支持80 语言识别,提供数据标注和合成工具,支持服务器、移动、嵌入式和物联网设备之间的训练和部署
一、下载
在群辉Docker搜索paddlehub_ppocr或者通过链接下载PaddleOCR
https://hub.docker.com/r/duolabmeng666/paddlehub_ppocr
二、安装
在Docker镜像中启动paddlehub_ppocr高级设置中设置端口把本地端口设置9000
环境的启动命令输入/bin/bash -c “sh /PaddleOCR/start.sh”
三、使用
计算待识别图片的Base64编码
发送服务请求(发送参数,参考下面命令)
curl -H "Content-Type:application/json" -X POST --data "{\"images\": [\"iVBORw0KGgoAAAANSUhEUgAAAHkAAAAnCAYAAAArfufOAAAEvElEQVR4nO1bMWsbSRT clyv4sAWGAS5wpUN8UGuSmlQEBHpsp0LgZy4cOkuwhHqrDKFkERcpMqWQZcgkRQurrJBNifjwo3BYEcSpNAv2Huzu5JWu7Pe2dWubDLzNV7P7r5987733rx5Yz8yCFD4pfHbfSugkDwUyRJAkSwBFMkSQJEsARTJEkCRLAEUyRJAkSwBFMkSQJEsAbwkn nQdqo4PBN4W jZATrlKrTydww5d4dfGyRDx7mgwg8Vsc D2bbZE/tuwHO/x6WTL/o9/NsHVvPrWIoqg024fj2XGtnXeyg8mf7OjLPbGoWWs5rfQiW3LPSs8DfSG3i/vzljn/MTmm/3mhznAqWahjXee2QXS/4FOdc6/xmMSe5/R6l8ikvHjU69io7QVJzPplDY30Y27VC2xeRmUGKGsclyGzwQTzToNb bLFN8xCG8hgpGxt AHvRwuNPGVSj5wd84b1ZRufWOrxX3oNv2quw0PHY19WGOz3EQNyyS05uo1DatkTBEBD1LzqN3WRSJGtImrM uvQ4jHZhzvyYbfwZWZm4wO7UpsMiBBBw7wXRNitQpisnTdn2dpYd/zHQzIm twiJ2D 7LM0lp9kU1/Z3xbHquPam49FUHs279DS8Rn4pvlLm6cnR/6/n0IvrM0O JIdJ11ycHVkRyYnEqewMCvkU0ErNpDSrQEthJfEoni9dL W2oeesazPtdmflMcLCwinTg4jLnS/JYdK1B2yNd4671nyn7CiGeHjo4bjrd08gWyTszAmkaztNU9oooW0VFeM1P4YqOV7Ml64nOLuYZL1jiujjp84AiVZ4xYn40zXbMrFKl9aFYbMdXbOFIJ7qmm13VtMpXPavcXVLP sNrFDRuBGvspERf7pmUbtvXfKaH8EY4PSECo/0n9H31YuEuYPI4Fl hMtWBtq BrDoLOtUb4QR5NxZ3I3AAHRtq5JvhojCs26H3fNGwfzpmvUBkN iqP08GVsrbqHQPAJuwkheRpZ2Flnf 1MnCNOQYXg4JDv36gvDnOmaMplZURfJ4F dN4iwomYVld2YCi97t5LNb CqdYTznKjeNsm8vVm0jhe4 7RIsCP7cdju2AIxvB1Rxtk2je2/NMVReE27Wy9ymxje0DvNnrCdTZLv3JvdF/o/zdT9OFaZ7vbtKHS6RusjNLNRY3XkConv5b3drSW2HFDq1poQIvrOdG15mbs3OkevOP0HrWmzhZqfg7EoYVHwd5xRfC9LwjwYr8PMoZzZgK3fz3FDy4cI0dzzZOvYjAgGpV4OkRuUQvWXP7FLz2g7DXQEKkIT6WUzMjsnQUdodruTnGIRFTZzZt6R6Xjc75g0UZjHuHYw1Xg9/HUUahTRt 1ADh5N/xfKUcKHWVcnKZBzAsXLBKINEXsbgIhHgjxMq1KriOq4xof9AZbSnKrVpTNve2nVNSlPWzP0UaPjW8Lty8k7Poc6jOTBl7rx6s2B8eHUiI4f34y3JOPtl/5kqNc4MF69 2YM5hAbL/pG 92BOVennqFgz9M9L8uGn4xewJgbUxv9Z3xgct/UjfaPaKqNeXR/0xHJCr8q1N94SQBFsgRQJEsARbIEUCRLAEWyBFAkSwBFsgT4HxQ8/CE4B3ErAAAAAElFTkSuQmCC\"]}" http://127.0.0.1:9000/predict/ocr_system
返回结果(如果调用成功,会返回如下结果)
{"msg":"","results":[[{"confidence":0.9853195548057556,"text":"测试图像路径,可以是单张图片路径,也可以是图像集合目录路径","text_region":[[5,10],[466,10],[466,24],[5,24]]}]],"status":"000"}
四、模型文件
为什么要映射模型文件自带的模型文件可能太老所以贝贝建议映射到群辉的文件夹里就可以时时更新,如果不需要可以忽略。
最新模型文件地址:https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_ch/models_list.md
文本方向分类模型 ch_ppocr_mobile_v2.0_cls_infer
文本检测模型 ch_ppocr_mobile_v2.0_det_infer
中文识别模型 ch_ppocr_mobile_v2.0_rec_infer
下载的时候直接下载推理模型就可以了
五、映射
Docker启动PaddleOCR后
输入删除自带的模型然后我们关机。
rm -rf /PaddleOCR/inference/*
输入可以查询模型文件是否删除成功如果有输出路径说明没删掉反之删除成功。
find / -name "inference.pdiparams.info"
创建本地文件夹并且映射/PaddleOCR/inference/然后我们把模型放进去就可以了,文件夹名称参考第四部。
评论(0)