图像文字提取功能

实现图像文字提取功能

系统:macOS

相关教程:https://segmentfault.com/a/11...

一、安装软件

# 基本安装
brew install  tesseract

# 安装tesseract的同时安装训练工具
brew install --with-training-tools tesseract
 
# 安装tesseract的同时安装所有语言,语言包比较大,如果安装的话时间较长,建议不安装,按需选择
brew install  --all-languages tesseract
 
# 安装tesseract,并安装训练工具和语言
brew install --all-languages --with-training-tools tesseract 

二、查看安装

# 安装后软件位置

/usr/local/Cellar

# 语言库地址

https://github.com/tesseract-ocr/tessdata

# 语言包位置

/usr/local/Cellar/tesseract/4.0.0_1/share/tessdata

进入语言库下载简体中文并放到语言包位置

图像文字提取功能_第1张图片

图像文字提取功能_第2张图片

三、测试

输入 tesseract 测试是否安装成功

图像文字提取功能_第3张图片

测试图片识别

tesseract + 图片路径 + 保存结果名 + -l 语言集

原图片

图像文字提取功能_第4张图片

识别后

图像文字提取功能_第5张图片

感觉马马虎虎吧,但是功能实现了,该出来的都出来了

不定期更新:Github

你可能感兴趣的