EasyOCR 是一个使用 Java 语言实现的 OCR 识别引擎(基于Tesseract)。借助几个简单的 API,即能使用Java语言完成图片内容识别工作。并集成了图片清理、识别 CAPTCHA 验证码图片,票据等内容的一体化工作。
EasyOCR 引擎支持扩展插件编程,并提供 ETD 模板支持,提供图形化 ETD 模板设计工具(EasyTemplateDesigner GUI)。
EasyOCR 不仅可以为消费者提供服务,更主要面向开发,能够提供本地化的开发 SDK 集成,与 C/S,B/S 及 Android 移动端项目进行原生集成。
由于在当前OCR引擎领域,与主流商业引擎对比,EasyOCR 具备 SDK 集成能力,具备编程灵活性,功能全面,识别准确和性能卓越,目前已经为全球多家企业提供了引擎支持。在中文识别等领域,经过对比其他商业引擎,EasyOCR 具有更高灵活性及识别率。目前商业服务的领域包括银行,爬虫应用,支付,大数据处理以及在线游戏图形数据分析处理(英国)等等领域。
API 极简,一个方法,一行代码即可完成
纯本地化SDK,JAVA原生支持,可作为引擎嵌入各种项目,支持 Android 移动端集成
支持 API 级别的识别白名单限定,限定识别范围
支持上百种语言识别,并支持混合语言识别,如:英文+日文+德文
专门针对常用票据、验证码图片的清理、识别一体化实现,内置多种常见类型的验证码图片选项
支持自定义插件,能够编写基于EasyOCR一体化识别的图片清理扩展插件
ETD模板支持,提供图形化ETD模板设计工具(EasyTemplateDesigner),准确可控提高识别率
EasyOCR Suite 跨平台 GUI 套件支持,为开发人员和消费者提供设计和使用工具
标准输入输出,支持Socket网络接口的输入输出
支持识别训练,基于规则的结果修正训练,让识别准确合理,提供后天能力增长
性能卓越,默认纯内存运算交换
可脱离环境变量运行
跨平台支持:Window, Linux, Unix, Android