正在查看 15 个帖子:1-15 (共 15 个帖子)
  • 作者
    帖子
  • @193152 回复 ⚑举报 

    摩诃
    游客

    原文只是代码片段,盼请 Python 高手实现:

    采薇数字人文06:古籍书影自动修图程序及开源代码

    mp.weixin.qq.com/s/LjN...UW02rGcnqA

    @193156 回复 ⚑举报 

    书格AI
    参与者

    您提出的“古籍自动修图程序及开源代码”是一个非常有意义的项目。

    实现这样一个功能完善的程序,需要扎实的Python图像处理、计算机视觉,甚至可能涉及深度学习等方面的技术。由于这不仅仅是几个代码片段的组合,而是一个完整的应用开发,建议您可以在GitHub等开源社区发起项目,详细说明您的具体需求和现有代码片段的基础,这样更容易吸引到有兴趣和能力的开发者共同参与。

    或者,您可以尝试将需求进一步细化为几个子任务,例如:图像去噪、倾斜校正、文字区域提取、墨迹增强等,这样更容易找到能够提供具体技术帮助的专家。

    (以上内容由Gemini AI自动答复,仅供参考!)

    @193157 回复 ⚑举报 

    未曾
    管理员

    这都是人家吃饭的东西~应该很难吧

    或直接问他们看看愿不愿意分享?

    @193165 回复 ⚑举报 

    野草
    游客

    @摩诃 #193152

    这个应该很麻烦吧,不过给出逻辑还挺好的。

    @193168 回复 ⚑举报 

    Whyme
    游客

    我看了调用的python库,

    import os、import tkinter、from pathlib import Path、from PIL import Image, ImageTk、import cv2、import numpy as np、from matplotlib import pyplot as plt

     

    上面所说的分别是一些系统组件调用、图像的常规处理、程序图形化绘制的一些库。

    他提到的一些作用,我不太理解为什么要做这些功能,因为这些程序实现的功能相当有限。

    我看过很多分享的古籍。来自国外大学图书馆的通常扫描质量很高,图像清晰,位置端正,不需要进行图像修复。至于民间流传的一些确实有不少噪点,歪歪斜斜也是常有的事情,如果使用机器学习或者其他AI领域的算法来进行大面积的修改,可能会产生歧义,因为这些往往是本身就有涂改或者手工标注的情况,会导致模型无所适从。

    @193176 回复 ⚑举报 

    摩诃
    游客

    @未曾 #193157

    在微信问了,等答复。

    @Whyme #193168

    里面的切边、分页、纠斜,这几个自动化功能很实用的。文中提到的算法,感觉很牛,可惜我图形处理和数学都不好,看不懂。

    突然想到可以咨询ComicEnhancerPro的作者老马

    @193220 回复 ⚑举报 

    Ru_Evan
    游客

    重点是调参

    @193239 回复 ⚑举报 

    白身
    游客

    没啥用,裁切还容易裁错了,纠正导致的形变容易出现很多认不清的字

    @193251 回复 ⚑举报 

    Whyme
    游客

    @摩诃 #193176

    楼下的回复说的对,实际上你提到的算法并不太有用。只是那篇公众号文章里的案例看起来不错而已。切边 分页 纠偏 都需要固定坐标,并不是很智能的。很多人在使用这些算法时,都会使用色差或者纸张大小做为定位依据,很多古籍上都有油墨污渍之类的东西,以色差作为定位依据实际上会出现各种问题。而纸张大小更没什么意思了。

    @193255 回复 ⚑举报 

    wd369
    游客

    古籍情况多样,如果是以前开发的,没依靠当前AI新技术,感觉还是很难做好。反而半手动操作更合适。
    比如用ComicEnhancerPro 的“扫描书籍处理”模式,半手工处理,也挺好用的。而且效率也不差, 古籍的细节处理很重要,平均下来一页花几分钟来处理也是可以接受。

    @193260 回复 ⚑举报 

    赤霄
    游客

    程序化处理案例是很理想化的,他这个没有测试软件,效果未知,就像楼上说的ai处理纠斜这些容易新增错讹,具体看使用者吧,有精力有实力的完全可以进一步研究,造福大家,普通的还是用手动操作,用多少裁拼单少。

    @193487 回复 ⚑举报 

    摩诃
    游客

    我开始觉得这点小要求,图像处理有经验、数学好的人,用ImageMagick +脚本 应该都可以。

    最近试了几个 OCR AI 软件,其中有内容定位技术(下图的颜色框),例如 MinerU 就是去掉天头地脚和注释,然后再识别。这个定位技术也许可以参考。

    test_ocr1_0_layout_det_res

    @195612 回复 ⚑举报 

    摩诃
    游客

    @摩诃 #193176

    在微信问了,等答复。==》已答复,内部使用不公开。

    咨询ComicEnhancerPro的作者老马==》已回复,我继续推荐ComicEnhancerPro

     

     

    @195859 回复 ⚑举报 

    米科
    游客

    看起来很高深,其实没什么用的玩意,自己看稍微差点也能将就,他这是为了卖钱才要做的好看

    @195954 回复 ⚑举报 

    aa
    游客

    这个大模型训练就可以了

正在查看 15 个帖子:1-15 (共 15 个帖子)
正在查看 15 个帖子:1-15 (共 15 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:盼请 Python 高手实现:“古籍自动修图程序及开源代码”
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1975年以后的资源需求或分享将会被清理删除。