批量图片识别 Umi-OCR v2.1.1

2024-4-1

Umi-OCR用于批量导入本地图片，识别图片中的文本，输出到软件面板或本地txt文件。除了能批量识别普通图片，本软件还有忽略指定区域的特殊功能。类似含水印的视频截图、含有UI/按钮的游戏截图等，往往只需要提取字幕区域的文本，而避免提取到水印和UI文本。本软件可设置忽略某些区域内的文字，来实现这一目的。尤其是，特别适合用于批量提取Galgame截图中的台词。当有大量的影视和游戏截图需要整理归档，或者想翻找包含某一段台词/字幕的截图；将这些图片提取出文字、然后Ctrl+F是一个很有效的方法。这是开发本软件的初衷

软件特点
忽略区域功能
忽略区域是本软件特色功能。可用于批量识别视频截图时排除右上角水印的干扰，批量识别游戏截图时排除UI与按钮的干扰，让识别结果只留下干净的台词文本。
“忽略区域”是指图片上指定位置与大小的矩形区域，完全处于这些区域内的文字块，将被排除。
点击设置选项卡中的添加忽略区域，进入忽略区域选择窗口。
将任意图片拖入该窗口，可预览该图片。将新图片拖入窗口可切换预览，但已绘制的忽略区域不会消失；可切换不同图片来仔细调整忽略区域。
绘制忽略区域：拖入图片后，点击选中左起第一按钮 +忽略区域 1 ，然后在图片上按住左键拖拽，绘制矩形区域。可撤销步骤。
绘制完后，点击完成返回软件主窗口。若不想应用此次绘制，则右上角X，取消。
本软件使用离线OCR模块 PaddleOCR-json 图片转文字程序，使用过程中无需联网。支持更换Paddle官方模型（v2.x版本）或自己训练的模型，支持修改PaddleOCR参数。通过添加不同的语言模型，软件可识别多国语言

更新日志
v2.1.1 主要更新 / Changelog
修复：Windows7及低端CPU无法进行文档识别的Bug
新增：批量文档识别允许指定忽略区域的页数范围
新增：命令行--path允许传入多个图片或文件夹
新增：新的命令行、HTTP接口：识别/生成二维码图像
优化：双栏面板会记忆左右折叠状态
完善繁+英+日界面本地化翻译

下载说明
不同版本仅OCR引擎插件不同，其它功能完全一致
均支持 win7 x64 及以上的系统，附带多国语言识别库

.7z.exe为自解压包，可以用压缩软件打开，也可以在没有安装压缩软件的电脑上直接双击解压

Paddle 引擎插件版
（性能好，速度快，占用率高，适合高配机器。不兼容奔腾、赛扬、凌动CPU）
重要提示：如果执行OCR时报错[Error] OCR init fail，大概率是CPU不兼容Paddle，请换用Rapid版本

Rapid 引擎插件版
（速度稍慢，内存占用低，适合低配机器，兼容性好）