解决PaddleOCR每次都要下载模型的问题
前提条件:PaddleOCR默认会从网络上下载预训练模型,这可能导致每次运行时都重复下载模型,尤其在网络不稳定或生产环境中会影响效率
pythonfrom paddleocr import PaddleOCR ocr = PaddleOCR(use_angle_cls=True, lang='ch') # 每次运行时都会尝试联网下载模型解决方法
1:手动下载并指定模型路径(通过设置模型路径,模型将在第一次使用时下载,第二次使用时直接去缓存路径查找)
pythonfrom paddleocr import PaddleOCR ocr = PaddleOCR( text_detection_model_dir='/path/to/det_model', # 检测模型路径 text_recognition_model_dir='/path/to/rec_model', # 识别模型路径 lang='ch' )- 确保路径下包含以下文件:interface.pdmodel、interface.pdiparams、interface.pdiparams.info
2:设置环境变量
texexport PADDLEOCR_HOME=/path/to/custom_directory3:Docker部署优化(将模型文件复制到镜像内)
dockerfileCOPY ./models /app/ocr_modelspythonocr = PaddleOCR( text_detection_model_dir='/path/to/det_model', # 检测模型路径 text_recognition_model_dir='/path/to/rec_model', # 识别模型路径 lang='ch' )