正在查看 15 个帖子:1-15 (共 15 个帖子)
  • 作者
    帖子
  • @135209 回复 ⚑举报 

    键史精神病
    游客
    @135210 回复 ⚑举报 

    键史精神病
    游客

    图例QQ截图20240417061132

    @135496 回复 ⚑举报 

    方午
    游客

    看你是自用还是对外开放的,费用除去开发,后续根据流量大小决定服务器的开支。

    可加我的微信abit2310

    @135606 回复 ⚑举报 

    键史精神病
    游客

    @方午 #135496

    不公開的話,那就如錦衣夜還鄉了。

    @135661 回复 ⚑举报 

    yang
    游客

    我也有这个想法,但是放弃了,服务器1-3万或更好,这个看数据量,没有上限。网站建设费用,从几千到几十上百万,都有,这个看自己需求,上面是一次性投入,然后就是网费投入,专线每个月几千打底带固定IP,大头投入就这些,还有域名,这个便宜,以上能承担就可以,  不行租服务器也可以,只需要投入网站建设费+服务器租赁费,

    @136119 回复 ⚑举报 

    键史精神病
    游客

    @yang #135661

    谢谢。看来这费用对我是个天文数字了。

    @136137 回复 ⚑举报 

    嘉良
    游客

    这里有两类费用,一个是网站,一个是写一个古文OCR识别的代码;其实如果用Github这种开源的网站的话,第一笔费用也就省下了,剩下就是OCR的费用了,这个就要看希望达到什么样的效果了,您展示的这个版式和文字内容都是相对清晰和工整的,但还有很多更加复杂的样式。

    @136170 回复 ⚑举报 

    古籍犹如大白兔
    游客

    俺正好是族谱宗谱相关工作者,一个临淄臭老九。他这个GITHUB页面,是个静态的,程序员开发的,这个叫族谱宗谱数字化。

    俺说说流程:

    第1步:先把族谱抄本OCR识别了

    里面有文字校对,是个非常仔细的活,不能有错字。顺序也要对了,要不辈分都乱了。因为这些古籍页面不是单纯的从右到左,它妹的还分层,有点小麻烦。

    tu_2024-04-25_15-26-10

    而且都是手写体,很多族谱宗谱都是从老房子里扒拉出来的,通常情况是下面这种水平。

    tu_2024-04-25_15-30-33

    所以 @嘉良 #136137

    提出的写个OCR识别代码,说的非常实际,印刷本的OCR相对好识别,识别族谱的我找了很多OCR商家都是垃圾中的战斗机。所以搞个OCR服务器是很猛的想法,看典古籍我刚看了下,做的也挺好,应该是个猛人开发。

    不过俺习惯了用云聪的古籍平台(凑合着用,很多连笔也要自己撅着腚一个个的校)。

    第2步 把识别的结果转成HTML

    这是程序猿的活了,咱也不懂,反正人家说把识别结果打印出来也行,这块没有啥子技术含量。

    服务器费用,问了一下

    fd

    服务器是小小头,模型才是人家的核心科技。

    如果给我30W,面对这些奸商,我做选择题!???

    fa082cd0e7277355bac6b6fc8e53e8ee~tplv-dy-resize-origshort-autoq-75_330

    我立马就搞个196T的大NAS,拿出5T存上书格的所有古籍,剩下的存姐姐们,人生就完美了。

     

     

    @136242 回复 ⚑举报 

    键史精神病
    游客

    @古籍犹如大白兔 #136170

    谢谢回答,虽然我看不懂别的,看到这个价钱吗,我就知道没戏了。

    @136273 回复 ⚑举报 

    嘉良
    游客

    @古籍犹如大白兔 #136170

    完全同意,特别是手写识别,几乎不可能完美。其实我自己就是做OCR的,如果有兴趣可以考虑一下合作。

    @136274 回复 ⚑举报 

    古籍犹如大白兔
    游客

    @嘉良 #136273

    你产品叫啥,能否观摩下,发个产品名

    @136414 回复 ⚑举报 

    蠹鱼
    游客

    @古籍犹如大白兔 #136170

    精彩呀,可以留个联系方式不,老哥

    @136417 回复 ⚑举报 

    古籍犹如大白兔
    游客

    @蠹鱼 #136414

    本人有家室,不约炮呢

    fa082cd0e7277355bac6b6fc8e53e8ee~tplv-dy-resize-origshort-autoq-75_330

    @136420 回复 ⚑举报 

    蠹鱼
    游客

    @古籍犹如大白兔 #136417

    老哥误会了,想请教家谱数字化

    @136533 回复 ⚑举报 

    看典古籍
    游客

    OCR也可以看看我们的,效果还不错,有多端支持

    www.kandianguji.com/ocr

正在查看 15 个帖子:1-15 (共 15 个帖子)
正在查看 15 个帖子:1-15 (共 15 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:请问github上,这种图文对照页面是怎么做出来的?另外,如果我自己要搭个服务器,作为类似看典古籍这样的网站,需要什么配置,大概多少钱?
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1973年以后的资源需求或分享将会被清理删除。