bookget 开源了（更新至：v25.0701）

标签：优质分享

正在查看 50 个帖子：2,451-2,500 (共 2,904 个帖子)

← 1 2 3 … 49 50 51 … 57 58 59 →

作者
帖子
2025年03月20日 22:36 @170203 回复 ⚑举报　

学惭淹贯
游客
@zhudw #170192
原来终极问题终于找到了，是后缀大小写的问题，不是网站对图片网址做了处理。感谢大侠。
2025年03月22日 17:17 @170324 回复 ⚑举报　

佐助小樱
游客
请教一下大神现在下载韩国国立图书馆老是失败
显示的代码是
2025/03/22 17:11:18 Disconnected from server
2025/03/22 17:11:18 Disconnected from server
2025/03/22 17:11:25 Expected status code 200 but got 404
这是哪里的问题呢
2025年03月23日 08:57 @170369 回复 ⚑举报　

河北无用
游客
只能等待大师zhudw有时间再施展绝技了
2025年03月23日 19:47 @170419 回复 ⚑举报　

zhudw
游客
@佐助小樱 #170324
你用 2 年前的软件，当然不能下载了。是什么理由，让你坚持用旧版，我想不通啊。软件是纯免费的。如果你看到有新版，请尽快升级。
2025年03月25日 20:18 @170551 回复 ⚑举报　

mlliu
游客
怎么发帖子回复贴文？
2025年03月26日 21:22 @170630 回复 ⚑举报　

佐助小樱
游客
@zhudw #170419
我也用最新版的试过，链接贴进去回车以后，弹出的浏览器能正常浏览，但是不能下载，又提示让输入网址。之前旧版的还能用，最近也不行了。
2025年03月27日 10:13 @170647 回复 ⚑举报　

zhudw
游客
@佐助小樱 #170630
看看这儿，需反复操作 www.shuge.org/meet/...ost-169883
2025年03月27日 15:29 @170669 回复 ⚑举报　

mbss
游客
国图49年以后得资料怎么下载呢？复制到bookget后生成了一个0 kb的pdf文件，等了许久都没有反应
2025年03月27日 17:20 @170675 回复 ⚑举报　

zhudw
游客
@mbss #170669
49年以后应该不算是“古籍”。你先确认是否能在线阅读，大概就是仅馆内阅读的书，不能看也不能下载。
2025年03月27日 17:33 @170681 回复 ⚑举报　

lsp
游客
zhudw老师您好！江苏高校珍贵古籍前几天还能下载，这几天只能下载几页，然后就不能了，网址也打不开了；变成403，重新拔了电源插头，再打开电脑，又能下载几页，又不能了，请问这是什么原因？谢谢！
2025年03月27日 18:23 @170683 回复 ⚑举报　
zhudw
游客
@lsp #170681
如果要挂机下一本书，大概要用“比较慢”的下载方式。江苏古籍和南图的服务器性能极差、速度稍快一点就会出现403。
修改 config.ini 文件中默认参数，或许可以解决。
```
threads = 1 #必备设置，1或2
speed = 5   #间隔时间，可选值5至12秒
```
2025年03月27日 18:45 @170689 回复 ⚑举报　

lsp
游客
好的，老师！我试试看
2025年04月01日 22:45 @171177 回复 ⚑举报　

轩辕十四
游客
@zhudw #170683
老师您好，麻烦请教下，印象中记得book某一版，是可以下载这种锁住资料的，但现在给忘了，请教一下是哪个版本来着？谢谢！
catalog.hathitrust.org/Recor...iewability

2025年04月02日 10:51 @171217 回复 ⚑举报　

zhudw
游客
@轩辕十四 #171177
Limited - search only 有这种提示的，是会员（以前有网友提过“常青藤”机构帐号登录）权限才能下载的。记得，曾有一段时间该站有漏洞，现在已经无法下载了。

2025年04月02日 14:54 @171242 回复 ⚑举报　

轩辕十四
游客
@zhudw #171217
谢谢老师回复，请问是哪个常青藤机构？百度了下好几个常青藤机构。。还是密歇根大学会员账号？还望指点下，谢谢！
2025年04月02日 15:40 @171244 回复 ⚑举报　

未曾
管理员
@轩辕十四 #171177
换个代理节点试试，我这里看是没有锁的

2025年04月02日 20:30 @171262 回复 ⚑举报　

zhudw
游客
@轩辕十四 #171242
这个我也不清楚是哪个常青藤。楼上 @未曾先生发现的有些IP还能直接下载。可能是针对某些地区开放的，我用日本IP看不到的。
2025年04月02日 21:21 @171270 回复 ⚑举报　

轩辕十四
游客
@zhudw #171262
好的，谢谢老师！
2025年04月03日 23:32 @171382 回复 ⚑举报　

无限
游客
@zhudw，用最新版，下载京都大学，第一张就卡住了。参数已经设置，
# 自动检测下载URL。可选值[0|1|2]，
# 0=默认，只下载支持的图书馆
# 1=通用批量下载（类似IDM、迅雷）
# 2=IIIF 标准类型网站自动检测
app_mode = 2
[dzi]
# 使用dezoomify-rs下载，仅对支持iiif的网站生效。
# 0 = 禁用，1=启用
dzi = 1
2025年04月04日 15:16 @171524 回复 ⚑举报　

zhudw
游客
@无限 #171382
dezmooify_rs 提示的 warn 警告，不是致命错误，一般只要网络正常可以继续下载。
若是因为连接数过多，导致的网络异常，请参考：www.shuge.org/meet/...ost-170683
2025年04月04日 16:31 @171534 回复 ⚑举报　

zhudw
游客
@无限 #171382
抱歉，和上述设置无关，京东大学已经用 IIIF 模式（原内置支持的功能失效），只有单任务多线程（由 dezoomify-rs 控制的）。
你遇到网络卡住，可能需要换个时间段（01:00-12:00 海底光纤会比较不拥堵)，或者换日本的代理IP试试。
或者尝试修改以下参数，用2个线程下载：
rs = "-l --compression=20 --timeout=300s --retries=5 --parallelism=2 "

2025年04月04日 19:45 @171561 回复 ⚑举报　

无限
游客
@zhudw #171534
感谢
2025年04月04日 20:45 @171572 回复 ⚑举报　

xiongyanan
游客
@未曾 #80239
先生好！日本静嘉堂有《周益公全集》，是抄本，《日藏中国古籍书志静嘉堂秘籍志》中有记载。恳请先生帮忙找下这本书的电子版。衷心感谢！
2025年04月06日 01:08 @171688 回复 ⚑举报　

学惭淹贯
游客
@zhudw #170683
设置间隔秒数，对江苏高校古籍似乎没有。不论是间隔1s、5s、10s还是20s，都是下到十三张或十四张图片就不能下，极有意思。然后插拔一下光猫，又可以继续下十三四张，就又不行了。看来是服务器专门进行了设置。
2025年04月06日 12:41 @171735 回复 ⚑举报　
zhudw
游客
@学惭淹贯 #171688
有没有可能，是他们网站太烂了。前面提到的参数也可以试试。
```
 rs = "-l --compression=20 --timeout=300s --retries=5 --parallelism=2 "
```
2025年04月08日 00:49 @171995 回复 ⚑举报　

学惭淹贯
游客
@zhudw #171735
采取
threads = 1
speed = 5
另外加上上面提到的
“rs = "-l --compression=20 --timeout=300s --retries=5 --parallelism=2 "”这条设置之后，结局依旧没有改变。还是下载十四张图片之后，就不能下了，网站也打不开，必须重启光猫，才能重新访问网站。
2025年04月08日 12:35 @172067 回复 ⚑举报　

zhudw
游客
@学惭淹贯 #171995
重启光猫能解决，你就用这个办法吧。他们在服务器端做限制，是很容易的事，限流量/限IP连接数。
你只能不断切换IP了。
2025年04月08日 13:27 @172071 回复 ⚑举报　

学惭淹贯
游客
@zhudw #172067
所以之前说看来是服务器专门进行了设置。
2025年04月08日 16:25 @172090 回复 ⚑举报　

zhudw
游客
@学惭淹贯 #172071
别纠结了，能下就下，不能下就换一家网站。
多说几句：国内的政企软件外包一般是多层外包，最后干活的一般都是小公司。预算减少后，硬件配置就会低。为了防止用户量大，都会做一些限制，即使不做限制，访问量稍大一些，也很容易宕机。就南图那个垃圾配置，频繁刷新几次都能弄挂他们网站。
2025年04月09日 03:44 @172159 回复 ⚑举报　

无限
游客
東洋國書館 kokusho.nijl.ac.jp/，斷斷續續...不知應該設置哪些參數
2025年04月09日 04:25 @172160 回复 ⚑举报　

无限
游客
@无限 #172159
下六张就会停下。
2025年04月09日 14:21 @172225 回复 ⚑举报　
zhudw
游客
@无限 #172159
能通过反复操作，半小时内完成一本书的下载，其实很可以了。
至于，下载过程中突然无法下载，都是服务端或网络问题，这此是不可控因素，没有一劳永逸的解决方法。
通过设置参数，加大间隔时间，减少连接数等操作，你可以在不同时间段（避开高峰期）尝试一下，直至试到满意为止。
如下例配置：
```
[download]
threads = 2
speed = 5

[dzi]
dzi = 1
rs = "-l --compression=20 --timeout=300s --retries=2"
```
2025年04月09日 14:34 @172226 回复 ⚑举报　
zhudw
游客
@无限 #172159
更正，如果实在无法解决，请放弃。同时，为避免反复回帖相同内容，我把这个参数配置放在wiki 07 一些小技巧
```
rs = "-l --compression=20 --timeout=300s --retries=5 --parallelism=2 "
```
2025年04月10日 22:43 @172428 回复 ⚑举报　

LXT
游客
zhudw老师晚上好！打扰您了！您开发的wiki，其中有三个网址打不开，分别是“台北故宫博物院善本古籍”，“云南中医药大学古籍数字图书馆”，“高丽大学海外资料中心”，不知道是网址变了，还是网站设置的不让打开了，望您解惑，先谢谢您了！
2025年04月11日 11:36 @172521 回复 ⚑举报　

zhudw
游客
@LXT #172428
kostma.korea.ac.kr/
高丽大学，还可以用这个网址打开。
另外两个可能是关闭网站了。

2025年04月11日 13:50 @172541 回复 ⚑举报　

LXT
游客
哦，明白了，谢谢老师！
2025年04月11日 23:56 @172615 回复 ⚑举报　

无限
游客
东洋国立国会図書館デジタルコレクション dl.ndl.go.jp/，好像失效了，下来只有空白文件夹
2025年04月12日 00:01 @172616 回复 ⚑举报　

无限
游客
按 @172225 ，修改参数可以了
2025年04月12日 00:01 @172617 回复 ⚑举报　

无限
游客
@无限 #172615
修改参数可以了
2025年04月12日 18:34 @172717 回复 ⚑举报　

mbss
游客
想问一下出现这种是什么意思呀？
WARN dezoomify_rs::network]network error HTTP status client error (404 Not Found) for url（www.*****.com). Retrying tile download in 3.6s.
2025年04月13日 12:10 @172832 回复 ⚑举报　

zhudw
游客
@mbss #172717
具体问题，具体分析。或是某网站使用了 dezoomify-rs 不支持的格式（非标准IIIF）。
可以到dezoomify-rs 官方github主页查看它支持的格式（提示：dezoomify-rs --dezoomer 是这个参数）。

2025年04月14日 17:02 @173030 回复 ⚑举报　

LXT
游客
zhudw老师！您好！苏州博物馆——古籍用bookget下载不了，用您重新设置的京都大学图书馆的参数也下载不了，是不是网站限制了？还是我不会调整参数？请您指教！谢谢您！
2025年04月15日 15:05 @173172 回复 ⚑举报　

囧
游客
多个链接下载新建了urls.txt，怎么才能不混合下载？想让它每次只下载一个链接，不要多连接同时下载。
chatgpt告诉我这样修改代码
// executeBatchURLs 处理批量URLs模式
func executeBatchURLs() {
urls, err := loadAndFilterURLs(config.Conf.UrlsFile)
if err != nil {
log.Println(err)
return
}
// 顺序下载，每次下载完一个再下载下一个
for _, rawURL := range urls {
if err := processURL(context.Background(), 1, rawURL); err != nil {
log.Println(err)
}
}
wg.Wait() // 等待所有任务完成
}
但是我不懂如何打包成exe执行程序，老师可以指点一下吗？我是小白。或者有什么简单的方法只让每次下载一行的链接，等待此链接下载完毕后再按照顺序下载其他的链接呢？
2025年04月15日 18:24 @173214 回复 ⚑举报　

zhudw
游客
@囧 #173172
config.ini 设置 threads = 1
对于要修改代码的，就看自己动手能力了，我不能指导编程。
@LXT #173030
苏州博物馆，手动下载吧，该站加了防火墙。稍后 wiki 中会移除这个网站。
京都大学的经测试可以下载，你有遇到问题，需要截图来说明，否则我也猜不出来原因的。
2025年04月15日 19:16 @173226 回复 ⚑举报　

LXT
游客
谢谢老师！京都大学可以下载了
2025年04月16日 22:30 @173408 回复 ⚑举报　

囧
游客
老师：
218.26.168.243:8300/tyrbp...howbc=true 这个地址原版阅读的图片怎么下载，有方法吗？
2025年04月17日 03:28 @173437 回复 ⚑举报　

无限
游客
bookget-gui 浏览器，打开后一片空白，而且无法右上角手动关闭，不知为何
2025年04月17日 03:38 @173438 回复 ⚑举报　

无限
游客
@无限 #173437
换了原包里的gui，可以打开了，但是天一阁网站已经没有登陆入口了
2025年04月17日 14:35 @173512 回复 ⚑举报　
zhudw
游客
@无限 #173438
貌似天一阁比较狠，直接禁止登录了。若是这样，便只好放弃了。
@囧 #173408
在原版阅读里面，按F12（书格有讨论这个）打开浏览器开发者模式。在里面找XML地址，用dezoomify-rs下载。
```
http://218.26.168.243:8301/tyrb/deepzoom/4d3e4aa1800304c57acbacc54eef92f1/14420.xml
```
2025年04月22日 17:18 @174319 回复 ⚑举报　

tigershuai
游客
zhudw老大，在下载e国宝的图时，比如https://emuseum.nich.go.jp/detail?langId=ja&webView=0&content_base_id=100141&content_part_id=0&content_pict_id=0这张图，config.ini中的dzi=0时只能下载到高最大10000像素点图，原大图不能下载到，如果dzi=1时，下载失败，界面如下：
作者
帖子

正在查看 50 个帖子：2,451-2,500 (共 2,904 个帖子)

← 1 2 3 … 49 50 51 … 57 58 59 →

正在查看 50 个帖子：2,451-2,500 (共 2,904 个帖子)

← 1 2 3 … 49 50 51 … 57 58 59 →

上传图片

拖拽或点击选择图片（最多五张）

回复至：bookget 开源了（更新至：v25.0701）

您的信息：

昵称/网名（必填）：

电子邮箱地址（不会被公开）（必填）：

发帖/回帖前，请了解相关版规：

0，邮箱地址尽量真实有效，随意填写的可能会被系统误判为垃圾内容。
1，不要开书单。单个帖子尽量发布一种书籍需求。
2，在搜索不到相关主题的情况下，尽量发新帖（发帖标题最好带上书名）。不要在他人帖子中回复某种书籍需要。
3，发帖提问标题尽量简单明了。发帖内容不要太过简略，请对书籍内容、版本或作者作简要说明。
4，出版于1976年以后的资源需求或分享将会被清理删除。