博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
使用 Python 识别并提取图像中的文字
阅读量:5319 次
发布时间:2019-06-14

本文共 820 字,大约阅读时间需要 2 分钟。

1. 介绍

介绍使用 python 进行图像的文字识别,将图像中的文字提取出来,可以帮助我们完成很多有趣的事情。

2. 必备工具

  1. tesseract-ocr

下载地址:

tesseract-ocr 是一个开源的图片OCR识别库, 功能及其强大,支持多国语言。

更高级的用法,它还支持机器学习算法,通过训练的方式,使OCR识别更加智能化及准确。

  1. python 库

使用安装 pytesseract 和 pillow 库:

pip install pytesseractpip install pillow

3. 开发使用

使用 python 配合 tesseract 识别文字中的图像可以非常简单,几行代码就可以搞定。

例如,识别下面这张图片:

913610-20190409135634170-659756499.png

首先导入 pytesseract 和 pillow 库

import pytesseractfrom PIL import Image

然后指定 tesseract 目录:

pytesseract.pytesseract.tesseract_cmd = 'f:/tessert/tesseract.exe'

然后使用 pillow 库加载图片:

img = Image.open('test.png')

最后使用 tesseract 识别图像的文字:

text = pytesseract.image_to_string(img, lang='chi_sim')print(text)

最后的结果是:

913610-20190409135623653-1913765688.png

可以看到,有偏差,但是基本上都识别出来了。

4. 总结

这里只是入门级的介绍,当然还有问题,比如彩色图像识别一般效果不好,对比度低的图像识别也不一定好,这就需要我们对图片进行处理后再来识别。比如提取灰度图片,锐化图片等操作,具体涉及到的是数字图像处理的领域了,这个后面有机会再讨论。

转载于:https://www.cnblogs.com/wangleiblog/p/10676481.html

你可能感兴趣的文章
《剑指offer》变态跳台阶
查看>>
Android环境搭建和编写helloworld
查看>>
《DSP using MATLAB》Problem 2.4
查看>>
ubuntu12.04通过ppa安装JDK7环境
查看>>
相关技术扩展地址
查看>>
jQuery.Callbacks源码解读
查看>>
[LeetCode] 68. Text Justification 文本对齐
查看>>
[LeetCode] 697. Degree of an Array 数组的度
查看>>
666 专题四 并查集
查看>>
模拟3
查看>>
小众公众号的简单运营
查看>>
Sql Server 附加没有日志文件的数据库(.mdf)文件方法
查看>>
系统调用方式文件编程-open
查看>>
python实战项目之爬虫(一)
查看>>
spring boot项目分享
查看>>
开放平台那些事
查看>>
CLion之C++框架篇-优化框架,引入boost(三)
查看>>
集合的addAll方法--list.addAll(null)会报错--java.lang.NullPointerException
查看>>
C#学习笔记—了解C#
查看>>
python使用dbm持久字典详解
查看>>