标签: 

正在查看 49 个帖子:2,451-2,499 (共 2,499 个帖子)
  • 作者
    帖子
  • @170203 回复 ⚑举报 

    学惭淹贯
    游客

    @zhudw #170192

    原来终极问题终于找到了,是后缀大小写的问题,不是网站对图片网址做了处理。感谢大侠。

    @170324 回复 ⚑举报 

    佐助小樱
    游客

    请教一下大神 现在下载韩国国立图书馆老是失败

    显示的代码是

    2025/03/22 17:11:18 Disconnected from server

    2025/03/22 17:11:18 Disconnected from server

    2025/03/22 17:11:25 Expected status code 200 but got 404

    这是哪里的问题呢

    @170369 回复 ⚑举报 

    河北 无用
    游客

    只能等待 大师zhudw有时间再施展绝技了

    @170419 回复 ⚑举报 

    zhudw
    游客

    @佐助小樱 #170324

    你用 2 年前的软件,当然不能下载了。是什么理由,让你坚持用旧版,我想不通啊。软件是纯免费的。如果你看到有新版,请尽快升级。

    @170551 回复 ⚑举报 

    mlliu
    游客

    怎么发帖子回复贴文?

    @170630 回复 ⚑举报 

    佐助小樱
    游客

    @zhudw #170419

    我也用最新版的试过 ,链接贴进去回车以后,弹出的浏览器能正常浏览,但是不能下载,又提示让输入网址。之前旧版的还能用,最近也不行了。

    @170647 回复 ⚑举报 

    zhudw
    游客

    @佐助小樱 #170630

    看看这儿,需反复操作 www.shuge.org/meet/...ost-169883

    @170669 回复 ⚑举报 

    mbss
    游客

    国图49年以后得资料怎么下载呢?复制到bookget后生成了一个0 kb的pdf文件,等了许久都没有反应

    @170675 回复 ⚑举报 

    zhudw
    游客

    @mbss #170669

    49年以后应该不算是“古籍”。你先确认是否能在线阅读, 大概就是仅馆内阅读的书,不能看也不能下载。

    @170681 回复 ⚑举报 

    lsp
    游客

    zhudw老师您好!江苏高校珍贵古籍前几天还能下载,这几天只能下载几页,然后就不能了,网址也打不开了;变成403,重新拔了电源插头,再打开电脑,又能下载几页,又不能了,请问这是什么原因?谢谢!

    @170683 回复 ⚑举报 

    zhudw
    游客

    @lsp #170681

    如果要挂机下一本书,大概要用“比较慢”的下载方式。江苏古籍和南图的服务器性能极差、速度稍快一点就会出现403。

    修改 config.ini 文件中默认参数,或许可以解决。

    threads = 1 #必备设置,1或2
    speed = 5   #间隔时间,可选值5至12秒
    @170689 回复 ⚑举报 

    lsp
    游客

    好的,老师!我试试看

    @171177 回复 ⚑举报 

    轩辕十四
    游客

    @zhudw #170683

    老师您好,麻烦请教下,印象中记得book某一版,是可以下载这种锁住资料的,但现在给忘了,请教一下是哪个版本来着?谢谢!
    catalog.hathitrust.org/Recor...iewability

     

    96AAFB27@25382D1D.3654E567_recompress

    @171217 回复 ⚑举报 

    zhudw
    游客

    @轩辕十四 #171177

    Limited - search only 有这种提示的,是会员(以前有网友提过“常青藤”机构帐号登录)权限才能下载的。记得,曾有一段时间该站有漏洞,现在已经无法下载了。

     

    @171242 回复 ⚑举报 

    轩辕十四
    游客

    @zhudw #171217

    谢谢老师回复,请问是哪个常青藤机构?百度了下好几个常青藤机构。。还是密歇根大学会员账号?还望指点下,谢谢!

    @171244 回复 ⚑举报 

    未曾
    管理员

    @轩辕十四 #171177

    换个代理节点试试,我这里看是没有锁的
    2025-04-02_154022

    @171262 回复 ⚑举报 

    zhudw
    游客

    @轩辕十四 #171242

    这个我也不清楚是哪个常青藤。楼上 @未曾 先生发现的有些IP还能直接下载。可能是针对某些地区开放的,我用日本IP看不到的。

    @171270 回复 ⚑举报 

    轩辕十四
    游客

    @zhudw #171262

    好的,谢谢老师!

    @171382 回复 ⚑举报 

    无限
    游客

    @zhudw,用最新版,下载京都大学,第一张就卡住了。参数已经设置,

    # 自动检测下载URL。可选值[0|1|2],
    # 0=默认 ,只下载支持的图书馆
    # 1=通用批量下载(类似IDM、迅雷)
    # 2=IIIF 标准类型网站自动检测
    app_mode = 2

    [dzi]
    # 使用dezoomify-rs下载,仅对支持iiif的网站生效。
    # 0 = 禁用,1=启用
    dzi = 1

    111

    @171524 回复 ⚑举报 

    zhudw
    游客

    @无限 #171382

    dezmooify_rs 提示的 warn 警告,不是致命错误,一般只要网络正常可以继续下载。

    若是因为连接数过多,导致的网络异常,请参考:www.shuge.org/meet/...ost-170683

    @171534 回复 ⚑举报 

    zhudw
    游客

    @无限 #171382

    抱歉,和上述设置无关,京东大学已经用 IIIF 模式(原内置支持的功能失效),只有单任务多线程(由 dezoomify-rs 控制的)。

    你遇到网络卡住,可能需要换个时间段(01:00-12:00 海底光纤会比较不拥堵),或者换日本的代理IP试试。

    或者尝试修改以下参数,用2个线程下载:

    rs = "-l --compression=20 --timeout=300s --retries=5 --parallelism=2 "

     

    @171561 回复 ⚑举报 

    无限
    游客

    @zhudw #171534

    感谢

    @171572 回复 ⚑举报 

    xiongyanan
    游客

    @未曾 #80239

    先生好!日本静嘉堂有《周益公全集》,是抄本,《日藏中国古籍书志 静嘉堂秘籍志》中有记载。恳请先生帮忙找下这本书的电子版。衷心感谢!

    @171688 回复 ⚑举报 

    学惭淹贯
    游客

    @zhudw #170683

    设置间隔秒数,对江苏高校古籍似乎没有。不论是间隔1s、5s、10s还是20s,都是下到十三张或十四张图片就不能下,极有意思。然后插拔一下光猫,又可以继续下十三四张,就又不行了。看来是服务器专门进行了设置。

    @171735 回复 ⚑举报 

    zhudw
    游客

    @学惭淹贯 #171688

    有没有可能,是他们网站太烂了。前面提到的参数也可以试试。

     rs = "-l --compression=20 --timeout=300s --retries=5 --parallelism=2 "
    @171995 回复 ⚑举报 

    学惭淹贯
    游客

    @zhudw #171735

    采取

    threads = 1

    speed = 5

    另外加上上面提到的

    “rs = "-l --compression=20 --timeout=300s --retries=5 --parallelism=2 "”这条设置之后,结局依旧没有改变。还是下载十四张图片之后,就不能下了,网站也打不开,必须重启光猫,才能重新访问网站。

    微信截图_20250408004838

    @172067 回复 ⚑举报 

    zhudw
    游客

    @学惭淹贯 #171995

    重启光猫能解决,你就用这个办法吧。他们在服务器端做限制,是很容易的事,限流量/限IP连接数。

    你只能不断切换IP了。

    @172071 回复 ⚑举报 

    学惭淹贯
    游客

    @zhudw #172067

    所以之前说看来是服务器专门进行了设置。

    @172090 回复 ⚑举报 

    zhudw
    游客

    @学惭淹贯 #172071

    别纠结了,能下就下,不能下就换一家网站。

    多说几句:国内的政企软件外包一般是多层外包,最后干活的一般都是小公司。预算减少后,硬件配置就会低。为了防止用户量大,都会做一些限制,即使不做限制,访问量稍大一些,也很容易宕机。就南图那个垃圾配置,频繁刷新几次都能弄挂他们网站。

    @172159 回复 ⚑举报 

    无限
    游客

    東洋國書館 kokusho.nijl.ac.jp/ ,斷斷續續,只能反復下載,不知應該設置哪些參數

    @172160 回复 ⚑举报 

    无限
    游客

    @无限 #172159

    下六张就会停下。

    @172225 回复 ⚑举报 

    zhudw
    游客

    @无限 #172159

    能通过反复操作,半小时内完成一本书的下载,其实很可以了。

    至于,下载过程中突然无法下载,都是服务端或网络问题,这此是不可控因素,没有一劳永逸的解决方法。

    通过设置参数,加大间隔时间,减少连接数等操作,你可以在不同时间段(避开高峰期)尝试一下,直至试到满意为止。

    如下例配置:

    [download]
    threads = 2
    speed = 5
    
    [dzi]
    dzi = 1
    rs = "-l --compression=20 --timeout=300s --retries=2"
    @172226 回复 ⚑举报 

    zhudw
    游客

    @无限 #172159

    更正,如果实在无法解决,请放弃。同时,为避免反复回帖相同内容,我把这个参数配置放在wiki 07 一些小技巧

    rs = "-l --compression=20 --timeout=300s --retries=5 --parallelism=2 "
    @172428 回复 ⚑举报 

    LXT
    游客

    zhudw老师晚上好!打扰您了!您开发的wiki,其中有三个网址打不开,分别是“台北故宫博物院善本古籍”,“云南中医药大学古籍数字图书馆”,“高丽大学海外资料中心”,不知道是网址变了,还是网站设置的不让打开了,望您解惑,先谢谢您了!

    @172521 回复 ⚑举报 

    zhudw
    游客

    @LXT #172428

    kostma.korea.ac.kr/

    高丽大学,还可以用这个网址打开。

    另外两个可能是关闭网站了。

     

    @172541 回复 ⚑举报 

    LXT
    游客

    哦,明白了,谢谢老师!

    @172615 回复 ⚑举报 

    无限
    游客

    东洋 国立国会図書館デジタルコレクション dl.ndl.go.jp/ ,好像失效了,下来只有空白文件夹

    @172616 回复 ⚑举报 

    无限
    游客

    按 @172225 ,修改参数 可以了

    @172617 回复 ⚑举报 

    无限
    游客

    @无限 #172615

    修改参数可以了

    @172717 回复 ⚑举报 

    mbss
    游客

    想问一下出现这种是什么意思呀?

    WARN dezoomify_rs::network]network error HTTP status client error (404 Not Found) for url(www.*****.com). Retrying tile download in 3.6s.

    @172832 回复 ⚑举报 

    zhudw
    游客

    @mbss #172717

    具体问题,具体分析。或是某网站使用了 dezoomify-rs  不支持的格式(非标准IIIF)。

    可以到dezoomify-rs 官方github主页查看它支持的格式(提示:dezoomify-rs  --dezoomer  是这个参数)。

     

     

    @173030 回复 ⚑举报 

    LXT
    游客

    zhudw老师!您好!苏州博物馆——古籍用bookget下载不了,用您重新设置的京都大学图书馆的参数也下载不了,是不是网站限制了?还是我不会调整参数?请您指教!谢谢您!

    @173172 回复 ⚑举报 

    游客

    多个链接下载新建了urls.txt,怎么才能不混合下载?想让它每次只下载一个链接,不要多连接同时下载。

    chatgpt告诉我这样修改代码

    // executeBatchURLs 处理批量URLs模式
    func executeBatchURLs() {
    urls, err := loadAndFilterURLs(config.Conf.UrlsFile)
    if err != nil {
    log.Println(err)
    return
    }

    // 顺序下载,每次下载完一个再下载下一个
    for _, rawURL := range urls {
    if err := processURL(context.Background(), 1, rawURL); err != nil {
    log.Println(err)
    }
    }

    wg.Wait() // 等待所有任务完成
    }

    但是我不懂如何打包成exe执行程序,老师可以指点一下吗?我是小白。或者有什么简单的方法只让每次下载一行的链接,等待此链接下载完毕后再按照顺序下载其他的链接呢?

    @173214 回复 ⚑举报 

    zhudw
    游客

    @囧 #173172

    config.ini 设置 threads = 1

    对于要修改代码的,就看自己动手能力了,我不能指导编程。

    @LXT #173030

    苏州博物馆,手动下载吧,该站加了防火墙。稍后 wiki 中会移除这个网站。

    京都大学的经测试可以下载,你有遇到问题,需要截图来说明,否则我也猜不出来原因的。

    @173226 回复 ⚑举报 

    LXT
    游客

    谢谢老师!京都大学可以下载了

    @173408 回复 ⚑举报 

    游客

    老师:

    218.26.168.243:8300/tyrbp...howbc=true 这个地址原版阅读的图片怎么下载,有方法吗?

    @173437 回复 ⚑举报 

    无限
    游客

    bookget-gui 浏览器,打开后一片空白,而且无法右上角手动关闭,不知为何

    @173438 回复 ⚑举报 

    无限
    游客

    @无限 #173437

    换了原包里的gui,可以打开了,但是天一阁网站已经没有登陆入口了

    @173512 回复 ⚑举报 

    zhudw
    游客

    @无限 #173438

    貌似天一阁比较狠,直接禁止登录了。若是这样,便只好放弃了。

    @囧 #173408

    在原版阅读里面,按F12(书格有讨论这个)打开浏览器开发者模式。在里面找XML地址,用dezoomify-rs下载。

    http://218.26.168.243:8301/tyrb/deepzoom/4d3e4aa1800304c57acbacc54eef92f1/14420.xml
正在查看 49 个帖子:2,451-2,499 (共 2,499 个帖子)
正在查看 49 个帖子:2,451-2,499 (共 2,499 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:bookget 开源了(更新至:25.0213)
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1973年以后的资源需求或分享将会被清理删除。