- 作者帖子
典存游客
典存游客
seligiv游客@典存 #104262
👍 十分相像,感谢
旭公子游客这是个半成品,搜索结果点进去链接根本就是乱飞。
明月照大江游客China Biographical Database Project (CBDB) (harvard.edu)
CBDB API | 中國歷代人物傳記資料庫(CBDB) (harvard.edu)
这里有1910年以前的中国历代人物传记
明月照大江游客古诗文网-古诗文经典传承 (gushiwen.cn)
这是一个古诗文的
看典古籍游客@典存 #104261
非常感谢您发现和推荐该网站
典存游客识别效果很不错 pdf 整体识别速度待提升 所以期待能出个离线版的 @看典古籍
格林游客刚才去这个(古籍 ocr)逛了一圈,他没有未曾先生的格局
有缺有优,书格可以借鉴有点
芥诚游客看了一下挺好的 如果网友有修改权限就好了 就像维基文库那样,机器ocr准确率有点低
看典古籍游客@旭公子 #104267
感谢反馈,这个bug已经修复了
看典古籍游客@典存 #104351
您的需求我会考虑开发的,现在还在提升OCR在古籍方面的准确度,其他功能会持续开发开放出来的
一蓑烟雨游客网站虽然是半成品,但是网站颜色搭配看着很舒服,一点也不刺眼睛,给个赞!
任行游客感谢推荐,ocr功能还有大量的空间,加油
看典古籍游客近期优化:
1、增加了古籍筛选功能,能更方便地进行古籍筛选
2、新增了一批古籍数据,现在已开放24000余册,100多万数字化图像
3、数字化功能和OCR功能优化
nanj游客古籍 ocr很實用,可惜第二天就無法識別,第三天表示圖片超過長度和寬度限制。是否要註冊才能識別。
看典古籍游客@nanj #109550
您好,感谢使用,关于您的问题,我测试了一下OCR功能是可以正常使用的
一、无法识别,服务刚上线不久,偶尔会有异常情况,您可以刷新几次页面或者稍后再试试。
二、长宽限制,目前我对于图像限制是3000像素,如果长宽错误建议您压缩一下图像之后再上传识别。
ps:网站稳定之后会放大图像的长宽限制。
三、OCR服务是不做注册限制的,打开网页就可以使用
炁游客他山之石,可以為錯
看典古籍游客
典子游客试用了一下,很大进步,就是感觉左右页面不能调节,右侧校对感觉需要区域更大。有点如是的味道了,再接再厉!
看典古籍游客
看典古籍游客9月调整,欢迎体验 看典古籍www.kandianguji.com/
1、【搜索】版块更名为【全文检索】
2、【善本大全】版块卡片高度对齐
3、阅读页文本添加加粗,根据识别数据按照可信度分不同颜色展示
4、阅读页新增【书内检索】功能,可在当前古籍中检索数据
5、阅读页新增【编辑】功能,开放用户校对编辑权限
6、阅读页分页添加输入跳转功能
7、【全文检索】检索结果正文内容加粗显示,检索词高亮显示,检索结果页顶部新增检索操作功能,更方便使用
8、【数字化】版块新增自定义图像尺寸调整
9、【数字化】版块新增用户【全书校对】功能,可在线点校自己的古籍,支持导出全书txt、json、图像以及双层PDF(可选择可复制文本层)
10、【古籍OCR】版块新增图像尺寸自定义功能
11、【用户】版块新增【找回密码】、【昵称修改】、【密码修改】功能
12、全站通知邮箱与反馈邮箱切换为admin@kandianguji.com
13、其它已知bug修复
典子游客厉害了 ,牛啊 ,目前看个人完全够用了 。
向者游客第一次打开网站看的第一本《历代帝王历祚考》的ocr就存在错乱。
另外,原本加水印,似显私心,并论于书格,未许。
看典古籍游客@向者 #112095
感谢使用和点评。首先OCR有错误的问题是无法避免的,我是一个人在做这个项目,目前开放的书籍是没有校对的,难免会有错误。其次水印的问题并不是私心,我是怕有人拿这边的图片乱搞,这个水印是动态的,明眼人一眼就能看出来图像的地址后面删了就是无水印的图像,并不是写死的。另外,难道在书格不可以发这个吗?如果不可以,我后面将不会在此发更新信息。
未曾管理员@看典古籍 #112099
我们并无此话题限制。反而,我们鼓励类似再开发利用。感谢
崇鹂游客从校对古籍的体验来说,OCR最重要地方,是其识别功能,是能够提供一个可编辑的校对稿,这个校对稿可能是10万字。如果用手一个字一个字去打,要以年为单位。如果有了可编辑的稿件,拿眼去检查,几个月就看完了。而且现在全网也没有识别率高、免费、不限量识别的OCR,能够免费不限量,已经很伟大。至于识别正确率的问题,可能需要时间积累,至少先解决网站生存问题吧。
至于另一个功能,提供已经识别好的古籍,个人觉得倒也不必,不过确实有很多人喜欢阅读、抓取这种可复制的文件。供你参考
書友游客
向者游客@看典古籍 #112099
并没有说限制,是看到标题与书格并论,表示不赞同这种说法的意思,因为水印(哪怕可以删除)而没有达到书格的开放程度。我认为水印是画蛇添足(你称可删除),既然放出来了,就不要在意别人使用,诚如书格。
典存游客楼上太吹毛求呲了,对于不愿花钱去像[如是古籍]这类网站购买服务(1.2元识别一张,个人用户可以8折)的人来说,【至少目前网站的识别率、免费、不限量识别,已经非常堪用了】,相当程度上提高了古籍的ocr效率,并且功能还在不断反馈完善中,感觉更需要给开发者多一点善意和耐心。未曾也表明了态度,这才是格局。
看典古籍游客@未曾 #112100
感谢未曾先生的答疑和支持!
看典古籍游客@崇鹂 #112102
感谢您的使用和反馈,网站也是才做没多久,有很多缺陷,我也在不断解决中,先从0到1搭建起来,再从1到99不断优化。
您说的提供已识别的古籍我考虑了还是会保留的,有许多用户喜欢在线看古籍的,自己存储,查找等也比较麻烦,能在线阅读和检索还是会方便不少
看典古籍游客@書友 #112109
感谢您的使用和反馈,OCR在识别结果后语句的排序模块有缺陷,我将在下一个版本中修复该问题
看典古籍游客@向者 #112123
感谢您的使用和评价,本贴主说的是和书格的【理念】相似,我本没有和书格去相提并论,这两个不在一个层次,我的格局不足未曾先生十分之一,但是我也在尽自己的能力去创造,去提升我的格局。关于水印的问题,我有多方面的考虑,在网站建设初期是没有水印这个东西的,我也没想着加,但是网站上线已经三个多月了,这期间有很多爬虫来抓取资源(是否恶意我也无法分辨),现在网站资源较多,带宽和流量费用很高,我开放出去的一张图像原图大一点的有18M左右,小一点也在3M上下,此前我有公网带宽可以直接提供图像服务,但是后面无法使用了,就需要通过其它方式去提供,我构建了全球可访问的多节点服务器,大都有流量限制,为了减少恶意抓取浪费流量,能够给真正的用户提供服务,我就保留了水印措施,后面条件适合我也会去掉水印,我自己本身也很不喜欢图像加水印,破坏原有的美感。
最好很感谢您能指出我的问题,祝愉快!
看典古籍游客@典存 #112130
感谢帖主的理解和支持!
辞海游客@看典古籍 #112137
我觉得有必要为你点赞
玄玄烂柯游客看典古籍里的这个版本,还是很珍贵的。
《奕薮》明·苏之轼撰,明天启二年自刻三色套印本
kandianguji.com/detail?id=10049- 作者帖子
正在查看 37 个帖子:1-37 (共 37 个帖子)
正在查看 37 个帖子:1-37 (共 37 个帖子)
正在查看 37 个帖子:1-37 (共 37 个帖子)