- 作者帖子
摩诃游客
书格AI参与者您提出的“古籍自动修图程序及开源代码”是一个非常有意义的项目。
实现这样一个功能完善的程序,需要扎实的Python图像处理、计算机视觉,甚至可能涉及深度学习等方面的技术。由于这不仅仅是几个代码片段的组合,而是一个完整的应用开发,建议您可以在GitHub等开源社区发起项目,详细说明您的具体需求和现有代码片段的基础,这样更容易吸引到有兴趣和能力的开发者共同参与。
或者,您可以尝试将需求进一步细化为几个子任务,例如:图像去噪、倾斜校正、文字区域提取、墨迹增强等,这样更容易找到能够提供具体技术帮助的专家。
(以上内容由Gemini AI自动答复,仅供参考!)
未曾管理员这都是人家吃饭的东西~应该很难吧
或直接问他们看看愿不愿意分享?
野草游客@摩诃 #193152
这个应该很麻烦吧,不过给出逻辑还挺好的。
Whyme游客我看了调用的python库,
import os、import tkinter、from pathlib import Path、from PIL import Image, ImageTk、import cv2、import numpy as np、from matplotlib import pyplot as plt
上面所说的分别是一些系统组件调用、图像的常规处理、程序图形化绘制的一些库。
他提到的一些作用,我不太理解为什么要做这些功能,因为这些程序实现的功能相当有限。
我看过很多分享的古籍。来自国外大学图书馆的通常扫描质量很高,图像清晰,位置端正,不需要进行图像修复。至于民间流传的一些确实有不少噪点,歪歪斜斜也是常有的事情,如果使用机器学习或者其他AI领域的算法来进行大面积的修改,可能会产生歧义,因为这些往往是本身就有涂改或者手工标注的情况,会导致模型无所适从。
摩诃游客
Ru_Evan游客重点是调参
白身游客没啥用,裁切还容易裁错了,纠正导致的形变容易出现很多认不清的字
Whyme游客@摩诃 #193176
楼下的回复说的对,实际上你提到的算法并不太有用。只是那篇公众号文章里的案例看起来不错而已。切边 分页 纠偏 都需要固定坐标,并不是很智能的。很多人在使用这些算法时,都会使用色差或者纸张大小做为定位依据,很多古籍上都有油墨污渍之类的东西,以色差作为定位依据实际上会出现各种问题。而纸张大小更没什么意思了。
wd369游客古籍情况多样,如果是以前开发的,没依靠当前AI新技术,感觉还是很难做好。反而半手动操作更合适。
比如用ComicEnhancerPro 的“扫描书籍处理”模式,半手工处理,也挺好用的。而且效率也不差, 古籍的细节处理很重要,平均下来一页花几分钟来处理也是可以接受。
赤霄游客程序化处理案例是很理想化的,他这个没有测试软件,效果未知,就像楼上说的ai处理纠斜这些容易新增错讹,具体看使用者吧,有精力有实力的完全可以进一步研究,造福大家,普通的还是用手动操作,用多少裁拼单少。
摩诃游客我开始觉得这点小要求,图像处理有经验、数学好的人,用ImageMagick +脚本 应该都可以。
最近试了几个 OCR AI 软件,其中有内容定位技术(下图的颜色框),例如 MinerU 就是去掉天头地脚和注释,然后再识别。这个定位技术也许可以参考。

摩诃游客
米科游客看起来很高深,其实没什么用的玩意,自己看稍微差点也能将就,他这是为了卖钱才要做的好看
aa游客这个大模型训练就可以了
- 作者帖子
正在查看 15 个帖子:1-15 (共 15 个帖子)
正在查看 15 个帖子:1-15 (共 15 个帖子)
正在查看 15 个帖子:1-15 (共 15 个帖子)


