亓先龙 发表于 2023-7-24 19:38:17

pytesseract and ddddocr

一.pytesseract

1.简介

 Pytesseract是一个Python库,用于将图像中的文本转换为可编辑的字符串。它是基于Google的Tesseract OCR引擎开发的 。Tesseract是一个开源的OCR引擎,能够识别超过100种语言的文字。Pytesseract简化了与Tesseract的集成过程,并提供了一个简单的API,使得在Python中使用OCR功能变得更加容易
2.环境配置

1)下载程序并安装,下载地址:https://digi.bib.uni-mannheim.de/tesseract/

 安装的时候记得勾选下载的语言,全选即可。
2)终端下载pytesseract库
pip install pytesseract下载安装完成之后在当前项目下找到venv\Lib\site-packages\pytesseract\pytesseract.py文件,修改tesseract_cmd值

3.基本用法

我们要识别图片文字,最常用的方法就是image_to_string,语法如下,通常使用时传两个参数即可,要识别的图片和语言类型
def image_to_string(
    image,
    lang=None,
    config='',
    nice=0,
    output_type=Output.STRING,
    timeout=0,
):下面看下实例
result_text = pytesseract.image_to_string("./img/img_5.png", lang='chi_sim')

# 输出结果
print(result_text)如果涉及到识别的图片中存在多种语言,可以在lang中添加多种语言,用+号连接起来
import pytesseract<br>from PIL import Image<br><br>img = Image.open(url)
text = pytesseract.image_to_string(img, lang='chi_sim+eng')# 识别中文和英文各种语言类型如下图
eng英文chi_sim简体中文chi_tra繁体中文ara阿拉伯文jpn日文kor韩文spa西班牙文fra法文deu德文ita意大利文por葡挞文rus俄文vie越南文tha泰文tur土耳其文dan丹麦文nld荷兰文fin芬兰文nor挪威文swe瑞典文hun匈牙利文cze捷克文pol波兰文slk斯洛伐克文slv斯洛文尼亚文bul保加利亚文ell希腊文est爱沙尼亚文lit立陶宛文lav拉脱维亚文ron罗马尼亚文srp塞尔尼亚文ukr乌克兰文hin印地文ben孟加拉文mar马拉地文tam泰米尔文tel泰卢固问kan卡纳达文mal玛拉雅拉姆文orl奥里亚文pan旁遮普文guj古吉拉特文sin僧伽罗文mya缅甸文 
二.ddddocr

1.简介

OCR是一种将印刷或手 写文本转换为可编辑文本的技术。ddddOCR利用深度学习算法识别图像中的字符,并将其转换为可编辑的文本。它可以应用于各种场景, 如扫描文档、图像识别、车牌识别等。ddddOCR具有高准确性和高效率,可以在短时间内处理大量的图像,并能够适应不同的字体和文字 样式。它可以应用于各种领域,如办公自动化、数据输入、图像处理等。
2.环境配置

pip install ddddocr3.基本用法

import ddddocr

ocr1 = ddddocr.DdddOcr()# 实例化
with open("./img_2.png", 'rb') as f:
    img_bytes = f.read()
result_text = ocr1.classification(img_bytes)
print(result_text)个人觉得ddddocr识别的特不准,毕竟是免费的,要想准确识别可以参考超级鹰:https://www.cnblogs.com/lihongtaoya/p/16727694.html
 

来源:https://www.cnblogs.com/lihongtaoya/p/17577991.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!
页: [1]
查看完整版本: pytesseract and ddddocr