正在查看 9 个帖子:1-9 (共 9 个帖子)
  • 作者
    帖子
  • @164845 回复 ⚑举报 

    泉说
    游客

    AI井喷百模争鸣的时代,有没有一种AI大模型可以自动校对重版的古籍?

    A图(重版) AI     B图(原版)

    两张图片一对比,重版内的错别字,与原版不同的字可以一目了然,对古籍重版可以起到极大推动!

    @164895 回复 ⚑举报 

    正音悉达
    游客

    能够对录的前提是100%识别内容,用统一的标准输出做对比

    如果不能做到100%精确识别,还是需要人工后期打补丁,那就不如干脆人工来做,

    @164900 回复 ⚑举报 

    泉说
    游客

    理论上很难百分之百重版古籍,即便人工校对也无法百分之百,AI校对可以弥补人工未能识别出来的错误。人工+AI可以最大可能减少错误,前提是AI校对模型要非常好使。

    @164903 回复 ⚑举报 

    oldestman
    游客

    目前来说对AI的应用不要太期待,先等等吧

    @164917 回复 ⚑举报 

    正音悉达
    游客

    我做过类似的事情,几个徒弟给我做前期前期工作,但是他们总有点小毛病,不能做到100%正确

    我还是要一个字一个字看过去,而且因为他们怎么说也有些基础,只会留下一些特别难分辨的错误,每次都要提心吊胆,我感觉反而更累了

    AI也是同理,校对这个事情,一本书只有一处错误和一本书有一百处错误,从工作量来看是一样的

    @164933 回复 ⚑举报 

    见贤思齐
    游客

    目前比较难,我前几天用国内某大模型做数据清洗,识别非常难,错误甚至大段的内容丢失,都需要人去识别补充,效率很低。

    @164945 回复 ⚑举报 

    游客

    用过目前流行的几个ai的图像识别,中国古文不用看了,完全没训练过似的,倒是外国古籍的识别还行,虽然有错但多少减少了工作量,可能是因为26个字母容易点吧。外国古籍主要是每个时间段流行的字体区别但量毕竟小,对手写体的识别还有待加强。中国古籍估计还没人专门喂数据训练过,投入高而且不能产生多少经济效益,有些做检索的软件正确率也有限,这也解决了部分问题但还是不能完全替代人工。

    @164948 回复 ⚑举报 

    游客

    我再举个例子吧,因为我也下棋,棋类ai它显示的是各个点位的胜率分布,这是用n多棋谱喂过训练之后的,但是有些局面高胜率的点走到后面会出现胜率大幅下滑,这就是坑。目前识别古字体的软件也一样,他也是给出几个概率不同的可能字体,有时候正确的字是概率很低的字,甚至完全不在他显示范围之内的,所以目前只能当参考来减少部分工作量用。

    @164958 回复 ⚑举报 

    泉说
    游客

    感觉技术上主要瓶颈是对原版的文字识别,重版的前提是手工编辑本身已是数字化数据,识别率应该很高。设想的这个应用场景好比是校对十万字的文章,想把文内某个词汇更改为新词汇,即便是人工校对多么认真,仍难敌一个查到替换命令。两相比较,即便不能百分之百识别出区别,若能排除90%的相同部分,对校对来说帮助仍是极大的。

正在查看 9 个帖子:1-9 (共 9 个帖子)
正在查看 9 个帖子:1-9 (共 9 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:AI井喷百模争鸣的时代,有没有一种AI模型可以自动校对重版的古籍?
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1973年以后的资源需求或分享将会被清理删除。