图片转文字 天若OCR离线版支持Win7

(编辑:jimmy 日期: 2024/12/23 浏览:2)


看到论坛有人分享天若的本地版:https://www.52pojie.cn/forum.php?mod=viewthread&tid=1525719
下下来发现Win7不能使用,我目前接触到的内网电脑一般情况操作系统都是Win7。基本上没有Win10,甚至还有Xp的。
于是根据 github 里面chineseocr_lite的解释:
https://github.com/DayBreak-u/ch ... e/onnx/cpp_projects
对于老平台的支持问题(主要指windows平台):
  • opencv通过自行编译,最老可以支持xp。
  • ncnn(cpu)通过自行编译,最老也能支持xp。
  • onnxruntime只能支持windows7~10。
  • 所以想上老windows平台,则只能选择ncnn版。

所以win7 xp 应该都是可以运行的。于是我使用该Github上面编译的demo 和开源的天若组装了一下,测试Win7可用。
接口选择本地即可。
图片转文字 天若OCR离线版支持Win7

image.png


图片转文字 天若OCR离线版支持Win7

image.png


识别效果还行。
添加一个生成二维码功能
既然是离线版,那么为了方便传输识别的文字,添加了生成二维码功能。可以把识别到的信息变成二维码。用手机扫一扫数据就可以传输到手机里面。
图片转文字 天若OCR离线版支持Win7

image.png


为了方便在内网里有的电脑安装运行不成功,或者配置比较低识别比较占用资源。可以远程访问网站进行识别
软件启动的时候同时开启了一个Web服务。端口为1111。访问http://ip:1111
可以打开网站,上传图片可以识别:
图片转文字 天若OCR离线版支持Win7

image.png


也开启转换接口的API:http://ip:1111/ocr?path=UrlEncode(本地图片地址)
如:http://ip:1111/ocr?path=G:\1.jpg  其中G:\1.jpg 需要UrlEncode 编码 实际访问为:http://ip:1111/ocr?path=G%3a%5c1.jpg
返回结果为Json串:
{ "image":  base64的图片信息, "elapse": 识别时间,"rec_res": [ { "words": "识别内容"}]}
下载地址:
https://www.lanzouw.com/b08yscg7g 密码:hanv
文件列表:
天若OCR文字识别_ncnn.7z  大小:9.1M 理论上xp 也能运行,但是我没环境没试过
天若OCR文字识别_onnx.7z  大小:15.7M
VC_redist.x86.exe  大小:15.7M VC的运行库

个人感觉ncnn识别大文件的时候没有onnx识别速度快。同时占用资源也多一点。不过正常截图识别区别不大,毕竟都是轻量级的模型库。
注:
1、程序调用chineseocr_lite打包的程序时候360或者其他杀毒软件可能会进行拦截提示,出现***该区域未发现文本***,应该都是都是被拦截了放行即可。
2、软件使用.Net4.0编写,请确保系统有.Net4.0的运行环境
3、如果识别的时候提示缺少DLL。应该是电脑没有安装C++运行库VC_redist.x86.exe。运行库已经也放到了蓝奏云里。

4、二维码传输字数限制为430个,太多了生成会出问题的。
5、关于识别率的问题,轻量级的模型识别速度快,准确率是有点问题。服务端的模型比较大,有100多M。识别慢、效果好。

个人不建议使用服务端模型,又大又慢。 使用天若OCR文字识别_ncnn.7z 和天若OCR文字识别_onnx.7z  就行了。没必要为了提高一点点准确率而去使用服务器端
服务端模型也已经上传到蓝奏云,由于蓝奏云100M限制,把模型分开了。使用方法:
载OCR-SERVER.7z、srec.7z两个文件,解压后把srec.onnx剪切到models文件夹里即可。
最终软件目录
Data
  --screenshot.wav
  --config.ini
models
  --scls.onnx
  --sdet.onnx
  --skeys.txt

  --srec.onnx
天若OCR文字识别.exe