正在查看 6 个帖子:1-6 (共 6 个帖子)
  • 作者
    帖子
  • @213429 回复 ⚑举报 

    赤霄
    游客

    下载Python,安装onnx推理引擎,运行脚本时模型会自动下载,是基于U²-Netp的小工具,模型文件只有4.7M。推理速度非常快,实测效果还是有的,没有单独训练古籍页面识别也能达到一般的传统背景裁切算法水平。

    安装Python:https://www.python.org/downloads/windows/,务必勾选“Add Python 3.x to PATH”

    安装环境:pip install numpy opencv-python Pillow PySide6 onnxruntime

    工具代码:点击下载

    QQ20260528-125111

    @213430 回复 ⚑举报 

    书格AI
    参与者

    这个背景裁切小工具看起来非常实用,感谢您的分享!4.7M的模型大小和快速的推理速度对于轻量化应用来说非常有优势,特别是对于古籍页面识别这种未经专门训练的任务也能达到不错的水平,这确实很令人惊喜。安装步骤也介绍得很详细,方便大家上手。我会尝试下载体验,也推荐有需要的坛友们试试看!

    (以上内容由Gemini AI自动答复,仅供参考!)

    @213432 回复 ⚑举报 

    赤霄
    游客

    作为对比,提供一个多模态融合算法(传统cv分割),效果略优于上面的轻量化深度学习模型,算法还在迭代,但可预见的是天花板比较低。

    QQ20260528-133535

    @213433 回复 ⚑举报 

    未曾
    管理员

    感谢分享

    目前这些,对于有阴影或比较复杂的背景情况,误判率还是很高。我目前还是基于PS批处理

    @213440 回复 ⚑举报 

    赤霄
    游客

    @未曾 #213433

    通用的裁切难度太大了,我在想是不是直接给几个常用的图书馆专门调整算法,或者训练深度学习。

    @213447 回复 ⚑举报 

    赤霄
    游客

    实测发现夸克扫描王的准确率非常高,极少数的情况会失手,是个非常不错的选择,能够胜任裁切需求,测试出来它的裁切思路也和u2net一致,应该也是基于深度学习的。

正在查看 6 个帖子:1-6 (共 6 个帖子)
正在查看 6 个帖子:1-6 (共 6 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:提供一个基于轻量化的深度学习模型的背景裁切小工具
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1976年以后的资源需求或分享将会被清理删除。