Skip to content

解决PaddleOCR每次都要下载模型的问题

  • 前提条件:PaddleOCR默认会从网络上下载预训练模型,这可能导致每次运行时都重复下载模型,尤其在网络不稳定或生产环境中会影响效率

    python
    from paddleocr import PaddleOCR
    
    ocr = PaddleOCR(use_angle_cls=True, lang='ch')
    # 每次运行时都会尝试联网下载模型
  • 解决方法

    • 1:手动下载并指定模型路径(通过设置模型路径,模型将在第一次使用时下载,第二次使用时直接去缓存路径查找)

      python
      from paddleocr import PaddleOCR
      
      ocr = PaddleOCR(
          text_detection_model_dir='/path/to/det_model', # 检测模型路径
          text_recognition_model_dir='/path/to/rec_model', # 识别模型路径
          lang='ch'
      )
      • 确保路径下包含以下文件:interface.pdmodel、interface.pdiparams、interface.pdiparams.info
    • 2:设置环境变量

      tex
      export PADDLEOCR_HOME=/path/to/custom_directory
    • 3:Docker部署优化(将模型文件复制到镜像内)

      dockerfile
      COPY ./models /app/ocr_models
      python
      ocr = PaddleOCR(
          text_detection_model_dir='/path/to/det_model', # 检测模型路径
          text_recognition_model_dir='/path/to/rec_model', # 识别模型路径
          lang='ch'
      )

MIT版权,未经许可禁止任何形式的转载