已创建交流区回复
- 作者帖子
未曾管理员不客气。
愿倶欢颜
未曾管理员确认就是普林斯顿大学图书馆的这套
未曾管理员
未曾管理员看这个文件名不是本站的资源,或者是被重命名过的文件。
你传一个文件到网盘共享给我看看
未曾管理员感谢。你可以有此下载此jpg文件包
未曾管理员请列一下文件名或者在线页面
未曾管理员感谢推荐,已进入待整理列表
未曾管理员因为会封IP(非香港),当然我个人测试,使用香港代理IP就不会被封
未曾管理员放大系数是16吧
url_template: "https://shuziwenwu-1259446244.cos.ap-beijing.myqcloud.com/relic/30e13deeba3747a29d3807366dd587d3/image-bundle/16/{{x/254}}_{{y/254}}.jpg" variables: – name: x from: 0 to: 54492 # Image width, taken from stage 1 step: 254 # Tile width, taken from stage 1 – name: y from: 0 to: 2160 # Image height step: 254 # Tile height - name: tile_size value: 254
未曾管理员这个我没注册也没法浏览。如果只是此书哈佛大学图书馆也有一个版本(黑白版)
下载链接: pan.baidu.com/s/1Qk...dImqRDzDRQ 提取码: xij2
未曾管理员
未曾管理员如果可以请留下书籍网址
如果需要登录,或有访问限制。那就爱莫能助了
未曾管理员测试了一下京都大学图书馆确实在程序端做了一定的防御,这样还不行的话就挂日本代理吧。我一般是加到日本的一台服务器上批量处理
未曾管理员感觉你的使用方法错误了。京都大学的递增没那么简单,他根据冊还有变化。
你用 ok.daoing.com/jddx/ 生成网址列表,然后复制,再用IDM的从剪贴板添加批量下载
未曾管理员如果实在是限制,我建议你使用日本的代理试试。其它解决方案,我也无能为力。或者你可以向京都大学反馈。
未曾管理员
未曾管理员我的测试是正常的
未曾管理员我测试是正常的,获取的网址可以正常打开。
未曾管理员
未曾管理员好像见于拍卖会。不在机构收藏范围,似乎也没有公开
未曾管理员可以参见此贴的相关回复
未曾管理员感谢你关注本站。我是本站的维护人。
我们是一个非盈利性质的网站,没有任何商业属性。所以目前合作是不需要的。
另外提示本站资源是完全开放的。
未曾管理员
未曾管理员目前没有完整的原色版。
永乐大典卷18244-18245,内容是:匠字韵引。其中18244摘录有《营造法式》内容。
xz.shuge.org/wl/?i...kvfu2CwjWF已知的(石印宋李明仲营造法式)黑白版可在线浏览
kotenseki.nijl.ac.jp/bibli...407/viewer
未曾管理员大致说一下原理
首先需要找到每册的libId。可以通过正则{libId:\"([0-9a-zA-Z+]+)提取到每册的libId
然后带入cookies获取每个libId页得到totalPageNum(总页码)和medaDataBatch(分册的URLid)两个参数
最后循环批量生成分页url
未曾管理员我自己使用命令行,基于imagemagick
按理说原理应该是一致的。只是我没有使用otsu算法。而是根据不同的书籍使用不同的阈值(40%-65%之间)
未曾管理员国图的资源需要带cookies抓取,所以相对麻烦些。而且频繁抓取容易封IP。我抓取了一份此书的分页url列表、
你可以批量下载,单页格式为PDF格式
分页网址txt文件: files.shuge.org/wl/?i...E58sILPRBm
未曾管理员旧版的网站黑白文件服务器更换了,基础程序也调整了。所以黑白版大面积失效。
DPI不用改,应该是和你选择的文件格式有关系
二值化文件推荐的文件格式是TIFF CCITT Group 4 (T.6)
未曾管理员这种地址栏只是程序上的类似映射的文件名,一般都是不行的,最终要在web展示还得JPG之类的
未曾管理员我已经整理下来了,你可以由此下载:法尔克亚洲旅行影像.Footage of the Falks' travel in Asia.彩色
未曾管理员YouTube的网址,有很多YouTube的下载器
未曾管理员和迅雷关系不大
用IDM试试
未曾管理员请注意可自动识别的链接格式可以是(类似):
www.loc.gov/item/2012402424/也就是 www.loc.gov/colle...38;sb=date 公布的资源
未曾管理员
未曾管理员我的意思这个(文件网址)列表你从哪里生产的
未曾管理员怎么批量下载的?列表从何而来
未曾管理员
未曾管理员批量再重命名为加上.jpg扩展名
未曾管理员未公开展示。你需要找那些能在线看的
未曾管理员可以由此生成
未曾管理员他们好像没有提供在线的服务,更谈不上下载
未曾管理员请大家相互少一些争吵,多一份宽容和理解。
大家都是因热爱而分享或再利用。是否作为商业,我觉得在于个人的境遇。
谢谢大家。
未曾管理员这种是软件自动重命名导致的。因为这种网址是中间参数变化,末尾相同,一般软件无法自动重命名。理想的解决办法我不知道有什么软件可以做到。按理说idm应该好一些。我现在用的命令行会逐行重命名为行号,所以不存在这个问题。
我以前使用软件下载使用的是设置为单任务,多线程下载,下载完的文件名混乱,但是按照下载(文件创建)时间重命名即可。你可以试试。
未曾管理员这些小工具是我简单写的,主要是方便自己使用的。网友们偶尔也有需要,因为写得不怎么好(界面),确实我也没有精力去为这些工具当个客服。我暂时就不列出来了。大家有需要可以记住即可。以后有时间再看看吧
未曾管理员你可以填写以上网址到此生成
未曾管理员新版的搜索目前只能检索网站发布的内容。
旧版的内容迁移需要一定的时间
未曾管理员个人不是很建议使用使用pdf格式对彩色TIF文件归档。
这种文件的归档直接文件夹或者压缩包即可
当然确实需要可以使用Adobe Acrobat DC,注意需要修改默认的TIFF转换默认设置
未曾管理员并不是我们不愿意分享,而是百度网盘的限制。我的分享后立刻会失败
只能通过好友分享,已做分享,自行查收
另外同步的问题在国内受到部分地区网络限制,可能不那么流畅。
未曾管理员我使用了PDF补丁丁
未曾管理员感谢关心
因为我外出了,一切更新就停止了
- 作者帖子