pytesseract and ddddocr

亓先龙 发表于 2023-7-24 19:38:17

一.pytesseract

1.简介

Pytesseract是一个Python库，用于将图像中的文本转换为可编辑的字符串。它是基于Google的Tesseract OCR引擎开发的。Tesseract是一个开源的OCR引擎，能够识别超过100种语言的文字。Pytesseract简化了与Tesseract的集成过程，并提供了一个简单的API，使得在Python中使用OCR功能变得更加容易
2.环境配置

1）下载程序并安装，下载地址：https://digi.bib.uni-mannheim.de/tesseract/

安装的时候记得勾选下载的语言，全选即可。
2）终端下载pytesseract库
pip install pytesseract下载安装完成之后在当前项目下找到venv\Lib\site-packages\pytesseract\pytesseract.py文件，修改tesseract_cmd值

3.基本用法

我们要识别图片文字，最常用的方法就是image_to_string，语法如下，通常使用时传两个参数即可，要识别的图片和语言类型
def image_to_string(
image,
lang=None,
config='',
nice=0,
output_type=Output.STRING,
timeout=0,
):下面看下实例
result_text = pytesseract.image_to_string("./img/img_5.png", lang='chi_sim')

# 输出结果
print(result_text)如果涉及到识别的图片中存在多种语言，可以在lang中添加多种语言，用+号连接起来
import pytesseract<br>from PIL import Image<br><br>img = Image.open(url)
text = pytesseract.image_to_string(img, lang='chi_sim+eng')# 识别中文和英文各种语言类型如下图
eng英文chi_sim简体中文chi_tra繁体中文ara阿拉伯文jpn日文kor韩文spa西班牙文fra法文deu德文ita意大利文por葡挞文rus俄文vie越南文tha泰文tur土耳其文dan丹麦文nld荷兰文fin芬兰文nor挪威文swe瑞典文hun匈牙利文cze捷克文pol波兰文slk斯洛伐克文slv斯洛文尼亚文bul保加利亚文ell希腊文est爱沙尼亚文lit立陶宛文lav拉脱维亚文ron罗马尼亚文srp塞尔尼亚文ukr乌克兰文hin印地文ben孟加拉文mar马拉地文tam泰米尔文tel泰卢固问kan卡纳达文mal玛拉雅拉姆文orl奥里亚文pan旁遮普文guj古吉拉特文sin僧伽罗文mya缅甸文
二.ddddocr

1.简介

OCR是一种将印刷或手写文本转换为可编辑文本的技术。ddddOCR利用深度学习算法识别图像中的字符，并将其转换为可编辑的文本。它可以应用于各种场景，如扫描文档、图像识别、车牌识别等。ddddOCR具有高准确性和高效率，可以在短时间内处理大量的图像，并能够适应不同的字体和文字样式。它可以应用于各种领域，如办公自动化、数据输入、图像处理等。
2.环境配置

pip install ddddocr3.基本用法

import ddddocr

ocr1 = ddddocr.DdddOcr()# 实例化
with open("./img_2.png", 'rb') as f:
img_bytes = f.read()
result_text = ocr1.classification(img_bytes)
print(result_text)个人觉得ddddocr识别的特不准，毕竟是免费的，要想准确识别可以参考超级鹰：https://www.cnblogs.com/lihongtaoya/p/16727694.html

来源:https://www.cnblogs.com/lihongtaoya/p/17577991.html
免责声明：由于采集信息均来自互联网，如果侵犯了您的权益，请联系我们【E-Mail:cb@itdo.tech】我们会及时删除侵权内容，谢谢合作！

页: [1]

翼度科技's Archiver

pytesseract and ddddocr