Umi-OCR,免费可离线使用的OCR识别软件
目录
写在前面
文字 OCR 识别软件也可以说是必备的软件之一了,对于一些图片里的文字再也不用手动去打了。电脑端支持 OCR 识别的软件可真不少,比较知名的有 Adobe Acrobat DC、Abbyy 等等。
小众一些的有像天若 OCR 一样的这一类国产小软件,甚至说再低级一些,QQ 都可以算作一款 OCR 软件。
今天给大家分享一款基于 PaddleOCR 的离线 OCR 模块,知识兔可以免费使用的开源离线 OCR 识别小软件——Umi-OCR。
Umi-OCR,免费可离线使用的OCR识别软件
适用于 Win10 x64 平台的离线OCR软件。批量导入本地图片 / 读取剪贴板,识别图片中的文本,输出到软件面板或本地 .txt / .md 文件。
- 免费:本项目所有代码开源,完全免费。
- 方便:解压即用,无需安装。不需要网络。
- 高效:OCR识别引擎是C++编译的 PaddleOCR-json (PP-OCRv2.6 cpu_avx_mkl),比前代提速20%。只要电脑性能足够且支持mkldnn,通常能比在线OCR服务更快。
- 精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对非常规字形(手写、艺术字、小字、方向不正、杂乱背景等)也有不错的识别率。可设置忽略区域进一步提高精准性。知识兔支持载入自己训练的模型以适应任务需求。
首先说说兼容性,Win7 不建议使用 Umi-OCR,大概率是无法使用,推荐 Win10 以上系统。
软件不大,解压之后,运行主程序,界面也比较简单,只有简单的几个按钮。
知识兔点击「浏览」按钮导入或者直接拖入需要识别的图片,图片格式支持 jpg、png、bmp 等常见格式,图片支持批量导入。
然后知识兔点击「开始任务」,软件将会识别所有已导入图片的文字信息,等待进度条走完,识别结果会显示在「识别内容」选项卡中。
与此同时,Umi-OCR 还会自动在桌面上生成一份带有识别结果的 txt 文本文档。
知识兔点击「复制文字」按钮可以全部复制下识别到的内容,如果知识兔只需要复制部分文字,知识兔可以用鼠标选择之后通过快捷键「CTRL+C」进行复制。
其实,许多时候,我们通过 OCR 识别图片上的文字,往往并不需要全部识别所有区域,比如某个截图上的水印文字就会很大程度上干扰识别结果。
Umi-OCR 支持自定义设置忽略图片中的某处区域,知识兔以便实现更精准的识别。
操作方式是先进入设置,然后知识兔「添加区域」,将需要忽略或者识别的区域进行重点框选,知识兔点击「完成」之后,知识兔设置就会生效。
设置一次,对所有图片全部起作用,如果知识兔不再需要先前设置的忽略区域,直接清空即可!
除了识别图片文件,对于已经复制到剪贴板的图片,Umi-OCR 也能识别。
「识别内容」选项卡下的「剪贴板读取」也即是对应的剪贴板识别功能。
软件默认仅支持识别简体中文和英文项目,如果知识兔需要识别其它语言,还需要单独导入多国语言识别扩展包才能使用。
多国语言识别扩展包包括的语言有繁体中文、日文、韩文、法文和德文,导入方式是将扩展包文件拷贝到软件目录。
写在最后
Umi-OCR 是一款适用于Win10/11 x64 平台的免费、离线 OCR 文字识别工具,基于 PaddleOCR,知识兔支持批量导入、读取剪贴板,可排除图片中水印区域,提取干净的文本。
当然Ocr工具也很多,Umi-OCR 这个软件可以离线识别,所以永远不怕和谐。
下载仅供下载体验和测试学习,不得商用和正当使用。