在Python中使用pytesseract库来识别图像中的文本非常简单。首先,你需要安装pytesseract库和Tesseract OCR引擎。然后,可以按照以下步骤使用pytesseract来识别图像中的文本:
- 导入pytesseract库和PIL库(Pillow):
import pytesseract from PIL import Image
- 使用Image.open()函数打开要识别的图像文件:
image = Image.open('image.png')
- 调用pytesseract.image_to_string()函数对图像进行文本识别:
text = pytesseract.image_to_string(image) print(text)
上述代码将输出识别出的文本内容。你也可以传递一些可选参数给image_to_string()函数,以指定识别语言、配置文件等。
注意:在使用pytesseract之前,请确保已经正确安装Tesseract OCR引擎,并且已经将其路径添加到环境变量中。