要使用Ubuntu上的PaddleOCR API接口,您需要首先安装PaddleOCR库并正确配置环境
- 安装PaddleOCR:
在终端中运行以下命令以安装PaddleOCR:
pip install paddlepaddle paddlepaddleocr
- 准备数据集:
为了训练OCR模型,您需要一个带标签的数据集。数据集应包含图像和相应的文本文件。例如,对于英语数据集,您可以使用EMNIST数据集。将数据集放在PaddleOCR/data
文件夹中。
- 训练模型:
在终端中运行以下命令以训练OCR模型:
python PaddleOCR/train.py \ -c PaddleOCR/configs/rec/ch_ppocr_server_v2.0_rec_infer.yml \ --train_dataset=PaddleOCR/data/ch_simfang \ --val_dataset=PaddleOCR/data/ch_simfang \ --train_batch_size=8 \ --rec_learning_rate=0.001 \ --save_dir=PaddleOCR/output
- 导出训练好的模型:
训练完成后,您可以导出训练好的模型。运行以下命令以导出模型:
python PaddleOCR/export.py \ -c PaddleOCR/configs/rec/ch_ppocr_server_v2.0_rec_infer.yml \ --model_dir=PaddleOCR/output/rec \ --save_dir=PaddleOCR/output/export
- 使用API接口:
现在,您可以使用导出的模型通过REST API识别图像中的文本。首先,安装Flask库:
pip install flask
接下来,创建一个名为app.py
的文件,并添加以下内容:
from flask import Flask, request, jsonify
import paddlepaddle
import paddlepaddleocr
app = Flask(__name__)
def ocr_client(image_path):
config = paddlepaddleocr.deploy.Config(det_model_dir="PaddleOCR/output/export", rec_model_dir="PaddleOCR/output/export")
det_loader = paddlepaddleocr.deploy.load_inference_model(config, det_model_type="CRNN")
rec_loader = paddlepaddleocr.deploy.load_inference_model(config, rec_model_type="CRNN")
img = paddlepaddle.io.read_image(image_path)
result = det_loader(img)
text = "".join([item["text"] for item in result])
return text
@app.route("/api/recognize", methods=["POST"])
def recognize():
image_file = request.files["image"]
image_path = "/tmp/" + image_file.filename
image_file.save(image_path)
text = ocr_client(image_path)
os.remove(image_path)
return jsonify({"text": text})
if __name__ == "__main__":
app.run(host="0.0.0.0", port=8080)
现在,运行app.py
文件以启动OCR API服务器:
python app.py
要使用API接口,您可以使用curl命令或Postman等工具向http://0.0.0.0:8080/api/recognize
发送POST请求,其中包含图像文件的base64编码。例如,使用curl命令:
curl -X POST -H "Content-Type: application/json" -d '{"image": "data:image/jpeg;base64,..."}' http://0.0.0.0:8080/api/recognize
这将返回图像中的文本。