正在查看 22 个帖子:1-22 (共 22 个帖子)
  • 作者
    帖子
  • @199123 回复 ⚑举报 

    赤霄
    游客

    软件功能简单,只有自动切分和拼合,没啥需要操作的地方,处理效果还勉强可以,凑合着用,效果没达预期时请使用其他工具,或将具体使用问题反馈至本帖,会集中处理。代码由深度求索自动生成,因为直接把所有库打包,软件较大。支持彩色和黑白图像,为了防止内存溢出,太高的像素会进行缩放。

    切分实现逻辑为:判断书页单双-单页切除多余内容-双页裁分并切除多余内容-编号输出图像
    具体为:智能判断古籍是单页、筒子页、相邻筒子页半页拼合哪种情况,将古籍大版面筒子页和拼页切分成两个小页面,并对拼页切分后的单页沿书口切除多余堆叠和背景,依次正确排序,要实现的效果,是分割成的两页基本能拼接成筒子页,筒子页也能从折痕处分割成右左两页。
    拼合实现逻辑为:判断书页单双-单页裁边后拼合-双页分割裁边后拼合。原本就是筒子页一般只有切分需求,也可以切了拼着玩。

    处理的情况有:单页、筒子页、相邻拼页、中缝很窄、小页面倾斜、小页面变形、书边缘堆叠、小页面尺寸有差异、天头地脚。

    @199124 回复 ⚑举报 

    赤霄
    游客

    软件界面

    QQ20251128-122500

    @199133 回复 ⚑举报 

    赤霄
    游客

    软件仅供个人非商业化使用,自行承担使用软件带来的一切后果,禁止私自商业化使用,禁止发布、售卖和修改发布、售卖本软件。

    链接:
    pan.baidu.com/s/1Rq...Q?pwd=z76f

     

    v1.0

    具备读取文件夹处理单双页混合图

    切边效果优化和检测切分位置优化v1.1再调整

     

    @199191 回复 ⚑举报 

    书友9527
    游客

    书友最近在疯狂的开发软件,厉害

    @199192 回复 ⚑举报 

    赤霄
    游客

    @书友9527 #199191

    主要是要重排印本神农本草,原书的明刻宋体阅读体验不行,于是得整个宋刻本字库,又不能一个个扣字,只好先写个字库生成软件;字库有了,就还差切页拼页的,可以用来预处理底本;在重排好后手机阅读,目前用的破解版天天报毒,只好也写一个阅读器;剩下的就是制版重排软件了,这个和字库检测识别共享一套技术,等字库识别攻克了就一起发出来。最后可以集成在一个软件,免得开几个,又是麻烦,最怕的就是麻烦,能一键解决最好。

    @199346 回复 ⚑举报 

    车马迟
    游客

    需要上下平行切分的,现在这版这种形式的切不了。

    @199365 回复 ⚑举报 

    linfeng
    游客

    @赤霄   求字库生成软件,万分感谢

    @199379 回复 ⚑举报 

    赤霄
    游客

    v2.1

    大幅优化了切分算法,效果略有提升,但书边缘还是不够准确

    QQ20251201-122529

    @199382 回复 ⚑举报 

    赤霄
    游客

    @linfeng #199365

    去这个帖子

    @199383 回复 ⚑举报 

    赤霄
    游客

    @车马迟 #199346

    支持左右平行切分,从中间和书口两侧切分,一般就是三条竖线,古籍一般形制是这样的。

    @199422 回复 ⚑举报 

    车马迟
    游客

    这种形式的目前切不了。

    00050008

    @199425 回复 ⚑举报 

    赤霄
    游客

    @车马迟 #199422

    可以列入后续支持内容,提供个四拼切双页选项,但这种一般是影印拼页,扫描也不清晰,效果不如高清原图切拼。

    @201522 回复 ⚑举报 

    赤霄
    游客

    v2.2

    新增上下栏四拼切分功能

    可选只切开上下两栏,或者处理成单页

    @201552 回复 ⚑举报 

    赤霄
    游客

    传一份在github备存

    github.com/chixi.../README.md

     

    @201689 回复 ⚑举报 

    摩诃
    游客

    github README.md 上的网盘链接,只发现版本v2.1。v2.2 好像还没有加入。

    @201724 回复 ⚑举报 

    赤霄
    游客

    已上传v2.2

    一段时间没弄,打包有点问题,将就了。

    QQ20251230-121534

    @202618 回复 ⚑举报 

    车马迟
    游客

    图片支持的格式是什么呢?

    @202629 回复 ⚑举报 

    赤霄
    游客

    @车马迟 #202618

    常见图片格式png/jpg/jpeg/tiff

    @202630 回复 ⚑举报 

    赤霄
    游客

    打算更新支持可选双层pdf图像切拼至v2.4,已经完成版本代码,暂未调式效果,这个比较有难度挑战。

    v2.3已再次梳理和优化切拼逻辑,有效增强处理单页优化去边缘、筒子页分割、组合双页切拼成筒子页,暂未更新。

    @202631 回复 ⚑举报 

    赤霄
    游客

    双层pdf完整还原难度比较大,涉及到裁剪后坐标位置偏移,初步实现是不考虑这么精细化,只要两个页面的内容还在就行,后期逐步优化。

    @202632 回复 ⚑举报 

    赤霄
    游客

    或者说可以建立一个可全文搜索图片格式标准.sotp,这个难度更大。

    @202633 回复 ⚑举报 

    赤霄
    游客

    感觉还是双层pdf靠谱,先研究怎么解决裁切后位置偏移。

正在查看 22 个帖子:1-22 (共 22 个帖子)
正在查看 22 个帖子:1-22 (共 22 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:古籍自动切拼工具
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1976年以后的资源需求或分享将会被清理删除。