小镇青年的文档中心

解决PaddleOCR每次都要下载模型的问题

前提条件：PaddleOCR默认会从网络上下载预训练模型，这可能导致每次运行时都重复下载模型，尤其在网络不稳定或生产环境中会影响效率
python
```
from paddleocr import PaddleOCR

ocr = PaddleOCR(use_angle_cls=True, lang='ch')
# 每次运行时都会尝试联网下载模型
```

解决方法

1：手动下载并指定模型路径（通过设置模型路径，模型将在第一次使用时下载，第二次使用时直接去缓存路径查找）
python
```
from paddleocr import PaddleOCR

ocr = PaddleOCR(
    text_detection_model_dir='/path/to/det_model', # 检测模型路径
    text_recognition_model_dir='/path/to/rec_model', # 识别模型路径
    lang='ch'
)
```
- 确保路径下包含以下文件：interface.pdmodel、interface.pdiparams、interface.pdiparams.info

2：设置环境变量

tex

export PADDLEOCR_HOME=/path/to/custom_directory

3：Docker部署优化（将模型文件复制到镜像内）

dockerfile

COPY ./models /app/ocr_models

python

ocr = PaddleOCR(
    text_detection_model_dir='/path/to/det_model', # 检测模型路径
    text_recognition_model_dir='/path/to/rec_model', # 识别模型路径
    lang='ch'
)