快捷搜索:  汽车  科技

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)如果我们需要知道识别的置信度,并以表格方式显示结果,可以在识别结果下方点击“以表格方式显示识别结果”纯文本方式显示使用了一下识别速度还可以。目前支持简体中文,繁体中文,和英文的识别。支持选取本地图片,和读取剪贴板支持选取本地图片和读取剪贴板来选择要识别的图片。识别结果默认是显示文字坐标位置的。在识别结果下方可以选择纯文本方式显示,只显示识别结果。

创作立场声明:值得买独发,欢迎收藏,点赞,➕关注。

经常会遇到文字识别的场景,在给别人做项目的时候也用到过一些文字识别方法,比较简单的方法就是调用大厂的api来实现(或者使用QQ,微信的识别,微软小程序等移动识别场景),也是当前应用比较多的场景,但是也有好多人的识别场景是担心数据泄漏的。

目前可用的离线OCR方案有 EasyOCR(CPU计算识别速度较慢),Tr,PaddleOCR,使用这些方案都是需要进行部署的。发现一个轻量化 免部署,可以离线使用的OCR,这个就是今天要讲的PearOCR

市面上提供OCR的软件大部分有各种限制(识别次数或者文件大小),需要收费才能解除限制,而PearOCR的识别完全免费,没有次数和文件大小限制。

使用

使用了一下识别速度还可以。目前支持简体中文,繁体中文,和英文的识别。

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)(1)

支持选取本地图片,和读取剪贴板

支持选取本地图片和读取剪贴板来选择要识别的图片。识别结果默认是显示文字坐标位置的。在识别结果下方可以选择纯文本方式显示,只显示识别结果。

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)(2)

纯文本方式显示

如果我们需要知道识别的置信度,并以表格方式显示结果,可以在识别结果下方点击“以表格方式显示识别结果”

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)(3)

以表格方式显示识别结果

如果识别结果有误,可以开启编辑模式,对识别结果进行编辑,可是这样编辑有什么意义呢?接着看

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)(4)

编辑模式

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)(5)

将识别结果导出为pdf

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)(6)

pdf预览

我暂时还没有遇到这样的使用场景,但是感觉还挺不错的,导出的pdf,可以直接使用搜索功能了。

说到这里,刚刚的操作还是没有明白这个还是在线使用的,和标题谈到的离线使用有毛关系?

离线使用

市面上的OCR软件大部分是利用大公司的API进行识别,需要把图片上传到服务器再返回识别结果,这个过程有可能导致个人数据的泄露和滥用。PearOCR基于自研的轻量化识别引擎,整个过程都在本地运算,不会把图片或者识别结果上传,从原理上保护数据安全。

PearOCR支持pwa标准,只要之前打开过网站,即使计算机断网也能正常访问使用,也可以以应用方式安装到桌面使用。

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)(7)

Chrome安装pwa应用

Chrome点击地址栏上的安装图标,然后选择安装即可,安装后在桌面可以看到pearocr的图标,点击图标即可打开pearocr

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)(8)

Edge浏览器安装应用

安装方法类似Chrome浏览器,但是安装后不会在桌面显示图标,而是加到windows应用列表里。

卸载方式:

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)(9)

卸载

使用感受

因为之前使用PaddleOCR自己做过训练,但是训练后的模型仍然是比较大,但是使用了这个方案后,感觉能将模型做到这么小真的非常了不起,我还特意去咨询了作者。

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)(10)

使用方式

总结

我特意地关掉wifi,进行离线使用了一下,对结果没有什么影响,但是使用的话仍然需要借助浏览器,想要通过其他方式来调用暂时是不可以的,如果你有离线识别需求,感觉部署方案比较麻烦的话,可以尝试使用一下。

本文经“什么值得买”社区作者@icybor授权转载,文章内容仅代表作者观点,与本站立场无关,未经授权请勿转载。

ocr识别过程中最核心的一环是什么(当前最好用的免费OCR)(11)

猜您喜欢: