人工智能研讨论坛(灵能智能)

搜索
查看: 8047|回复: 0

[勇哥播报] 勇哥开源播报之:开源光学字符识别引擎tesseract-ocr

[复制链接]
发表于 2014-2-20 21:05:59 | 显示全部楼层 |阅读模式
开源项目
项目名称: tesseract-ocr
项目主页: https://code.google.com/p/tesseract-ocr/
开源地址: https://code.google.com/p/tesseract-ocr/source/checkout
很久以来,勇哥就对图像识别很感兴趣,而文字识别更是很有意义。试想,机器人5号,能几分钟内读完一本厚书,我何不让它读给我听,最好能总结下,呵呵。于是,勇哥这次推荐一款文字识别引擎。

Tesseract可能是目前效率最高的开源OCR(光学字符识别)引擎,它是在1985年和1995年之间由HP实验室开发,现在由Google支持。在Leptonica Image Processing Library的支持下,它能够读取各种类型的图片格式,能将其中的文字转换为超过60种语言。在1995年的UNLV精度测试中,它是前三名引擎之一。1995年到2006年之间变化很小,之后由Google进行了大量改进,当前以Apache License 2.0协议开源。

Tesseract能工作在Linux、Windows(基于VC++ Express或Cygwin)和Mac OSX上。它同样可以编译为其他平台,如android和iPhone,这些平台并没有进行过很好的测试。

至发帖时,Tesseract 3.03版本的代码已经发布。安装、使用方法请参考项目主页。

Referred to:
图像识别类库 Tesseract OCR. http://www.oschina.net/p/tesseract-ocr
您需要登录后才可以回帖 登录 | 注册

本版积分规则

赞助通道

QQ|小黑屋|手机版|Archiver|人工智能研讨论坛(灵能智能) 苏ICP备11019567号

GMT+8, 2022-7-7 00:47 , Processed in 0.078464 second(s), 36 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表