正在查看 50 个帖子:1-50 (共 82 个帖子)
  • 作者
    帖子
  • @202463 回复 ⚑举报 

    未曾
    管理员

    最近计划把bookget的大部分下载功能使用浏览器(基于jszip和filesaver)实现。目的是为了减少大家对电脑环境的依赖。

    大致使用方法就是,粘贴需要下载的书籍URL。然后点击解析下载,浏览器会将书籍打包(zip)下载。

    当然,由于浏览器下载不一定稳定,在线获取适合临时救急使用。如果条件允许,我们还是推荐大家使用电脑+bookget

    小工具实验室主页

    tools.hanjihebi.com/

    由于需要针对性处理,暂公开测试几个

    国图(中华古籍资源库)打包下载器

    由于需要处理token,使用了PHP解析通过服务器中转文件到用户(可能速度会因服务负载变慢),最后前端浏览器JS打包压缩和下载。

    测试地址: tools.hanjihebi.com/nlc/

    2026-01-09_154745

    IIIF 智能下载器

    这个是纯前端实现的,不依赖服务器,但是需要用户浏览器能访问对应资源。

    测试地址: tools.hanjihebi.com/iiif/

    图片_20260109152745_792_43

    美国国会图书馆资源打包下载器

    这个是纯前端实现的,不依赖服务器,但是需要用户浏览器能访问对应资源。需要安装浏览器插件:Allow CORS

    测试地址: tools.hanjihebi.com/loc/
    2026-01-09_212554

    上海图书馆打包下载工具 (半自动解析)

    使用教程参见

    测试地址: tools.hanjihebi.com/shtsg/

    天一阁古籍下载打包器

    1. 本工具为纯静态页面,由于浏览器默认会拦截对 天一阁网站的跨域请求。
    请务必安装并开启 Chrome 插件: Allow CORS
    2. 批量下载时,浏览器会连续弹出多个 Zip 下载保存提示,请允许浏览器下载多个文件。

    测试地址: tools.hanjihebi.com/tygbwg/2026-01-15_193953

    宫内厅图书寮 - 链接提取与下载

    本工具为纯静态页面,浏览器会拦截对宫内厅 服务器的请求。
    请务必安装并开启 Chrome 插件: Allow CORS,开启教程可参见
    或者以禁用 Web 安全模式启动浏览器,否则下载会失败。
    等待链接获取完毕后,你可以复制链接到你自己的下载工具中下载。或直接使用网页在线打包下载。

    测试地址: tools.hanjihebi.com/gnt/
    2026-01-22_095701

    网址链接批量生成器 (通用打包下载器)

    你可以通过规律生成批量的URL列表,也可以粘贴你需要批量下载的URL。然后打包下载~

    测试地址: tools.hanjihebi.com/url/

    以上工具代码使用了Gemini辅助完成。

    欢迎大家测试使用!


    另外

    推荐安装插件Allow CORS

    由于使用的是纯前端 JS 获取。如果来源没有正确配置 CORS 头(允许跨域访问),浏览器会拦截 JS 的下载请求,并在日志中报错 "Failed to fetch"。

    需要安装这个浏览器插件(例如 "Allow CORS")来临时绕过浏览器的限制。

    插件(chrome)链接:Allow CORS

    edge浏览器也有这个插件,用edge浏览器也是一样的

    设置参考如图(勾选第3、4项)

    打开扩展程序点击左边logo启动插件,变亮则已开启

    003

    *如果平时不使用时请关闭插件,图标点成灰色即可(部分网站可能会引起冲突)

    @202464 回复 ⚑举报 

    玄默
    游客

    @未曾 #202463

    亲测有效

    @202469 回复 ⚑举报 

    xiaopengyou
    游客

    @未曾 #202463

    請教先生

    這個IIIF的下載器,是取代了以前的那個嗎?

    網址不一樣,但介面貌似一樣

    @202470 回复 ⚑举报 

    未曾
    管理员

    @xiaopengyou #202469

    这是优化重构过的代码(相较于一月前的版本)。计划统一发布到这里(tools.hanjihebi.com),未来会集成到一个导览页。

    @202471 回复 ⚑举报 

    夢夢
    游客

    用手机浏览器下载了国图一个四十来页的,速度不错。

    Screenshot_2026-01-09-17-53-31-516_com.android.browser-edit

    @202473 回复 ⚑举报 

    開物成務
    游客

    怎么提取地址?谢谢

    guji.nlc.cn/resou...ype=ziyuan

     

    @202475 回复 ⚑举报 

    xiaopengyou
    游客

    @未曾 #202470

    了解,謝謝

    @202477 回复 ⚑举报 

    xiaopengyou
    游客

    都是陶淵明學派,好讀書不求甚解!

    "国图(中华古籍资源库) "

    @202478 回复 ⚑举报 

    未曾
    管理员

    @開物成務 #202473

    中华古籍智慧化服务平台的分页逻辑相对复杂的,我还没开始针对处理。

    建议先用bookget处理吧,而且这种分页方式的,还是bookget处理更合适。当然我们未来也会尝试对中华古籍智慧化服务平台支持在线获取。

    @202485 回复 ⚑举报 

    未曾
    管理员

    增加了

    美国国会图书馆资源打包下载器

    这个是纯前端实现的,不依赖服务器,但是需要用户浏览器能访问对应资源。需要安装浏览器插件:Allow CORS

    测试地址: tools.hanjihebi.com/loc/

    @202504 回复 ⚑举报 

    鹦山读书人
    游客

    感谢未曾先生,美国国会的终于可以下载了。感谢!

    @202575 回复 ⚑举报 

    书友9527
    游客

    太好了,感谢

    @202605 回复 ⚑举报 

    oldestman
    游客

    @未曾 #202485

    美國國會的要安裝插件,我上不了谷歌,沒法安裝,有其他解決方法嗎

    @202608 回复 ⚑举报 

    未曾
    管理员

    @oldestman #202605

    edge浏览器也有这个插件

    用edge浏览器也是一样的

    另外,美国国会图书馆你不挂梯子能访问吗?

    @202609 回复 ⚑举报 

    未曾
    管理员

    更新:IIIF 智能下载器

    支持自动转换链接: 直接粘贴 Harvard, Gallica (BnF), 国文学研究资料馆 (NIJL) 的阅览页地址,程序会自动转换为 Manifest JSON 地址。

    例如哈佛的阅览页
    https://iiif.lib.harvard.edu/manifests/view/drs:24623648$1i
    
    法国国家图书馆(Gallica)的阅览页
    https://gallica.bnf.fr/ark:/12148/btv1b525041685.r=Chinois%201236?rk=21459;2
    
    国文学研究资料馆的阅览页
    https://kokusho.nijl.ac.jp/biblio/300112532/1?ln=en
    @202611 回复 ⚑举报 

    oldestman
    游客

    @未曾 #202608

    可以訪問

    @202710 回复 ⚑举报 

    游客

    @未曾 #202609

    先生好!哈佛的没挂梯子不能下载对么?

    @202713 回复 ⚑举报 

    未曾
    管理员

    @光 #202710

    嗯,这个是纯前端的程序,首先确保你自己能访问哈佛对应的资源。

    @202715 回复 ⚑举报 

    游客

    @未曾 #202713

    好的,谢谢!

    @202778 回复 ⚑举报 

    未曾
    管理员

    增加一个测试版:上海图书馆打包下载工具 (半自动解析)

    使用方法

    首先,用户需要注册上海图书馆的帐户,登录使用。
    其次,需要官方已公布数字资源在线。大致如图
    2026-01-14_140328

    一般打开的书籍页面是:https://dhapi.library.sh.cn/pdfview/,不是早期IIIF资源

    第三,需要手动复制参数,填写总页码。

    2026-01-14_134303

    然后,浏览器按F12进入开发者模式,点下一页(不要刷新页面)复制这里的 cURL 内容
    2026-01-14_140804

    打开测试地址tools.hanjihebi.com/shtsg/ ,填入以上信息到对应位置
    2026-01-14_141202

    然后点击打包下载,默认50页一个压缩包,如果失败可以更改起始页(从失败的页)
    2026-01-14_141342

    这个是纯前端实现的,不依赖服务器,但是需要用户浏览器能访问对应资源。

    这个下载目前使用还是比较繁琐,我还需要研究对应接口,看看还有没有简化的方法。

    @202792 回复 ⚑举报 

    問路人
    游客

    未曾先生,厉害。还是以前那个挺好。就是原来那种,不管新老系统,软件都可以下载高清图,图片再怎么处理成其他文件格式都方便。
    辛苦了,大爱无疆,福顺康宁。

    @202793 回复 ⚑举报 

    未曾
    管理员

    @問路人 #202792

    抱歉,我没听懂这段描述。什么以前那个?

    @202820 回复 ⚑举报 

    jsaren
    游客

    我估计他说的就是bookget

    @202864 回复 ⚑举报 

    yuewu
    游客

    感谢未曾先生分享这么方便好用的在线工具,最近天一阁新增了一部之前未开放的资源,不知道好不好弄,尝试了bookget现在好像失效了

    @202885 回复 ⚑举报 

    未曾
    管理员

    增加了:天一阁古籍下载打包器

    1. 本工具为纯静态页面,由于浏览器默认会拦截对 天一阁网站的跨域请求。
    请务必安装并开启 Chrome 插件: Allow CORS
    2. 批量下载时,浏览器会连续弹出多个 Zip 下载保存提示,请允许浏览器下载多个文件。

    测试地址: tools.hanjihebi.com/tygbwg/2026-01-15_193953

    @202887 回复 ⚑举报 

    karlie
    游客

    用网页打开最后提示> 错误: Cannot read properties of undefined (reading 'replace'),这是什么代码.

    @202889 回复 ⚑举报 

    karlie
    游客

    emuseum.nich.go.jp/iiifa...ifest.json

    来个好心人看看能不能把这个链接里的图帮忙下载下来,我完全搞不了,图倒是下载完了,最后打包直接提示错误代码

     

    undefined is not an object (evaluating 'baseName.replace')

    @202910 回复 ⚑举报 

    未曾
    管理员

    @karlie #202889

    感谢反馈~已修复

    因为兼容性问题导致

    它把 manifest.label 当作了传统的 IIIF 2.x 语言映射对象(例如 {"en": ["Title"]})。当它尝试读取数组中第一个元素(那个对象 {"@value":...})的第 [0] 属性时,因为对象不是数组,所以返回了 undefined。

    随后这个 undefined 被传给了下载函数,执行 undefined.replace(...) 时就报错了。

    @202939 回复 ⚑举报 

    問路人
    游客

    @未曾 #202793

    bookget 挺好用的,个人是碍于电脑系统太低的问题。

    @202978 回复 ⚑举报 

    jbgy
    游客

    ScreenShot_2026-01-17_110404_276WIN7系统 360浏览器,插件已设置,网站正常打开,下载提示错误,请问下这是怎么回事?

    @203324 回复 ⚑举报 

    ccicc
    游客

    你好,未曾先生。感谢您做的网页功能,我在使用国会图书馆下载工具时,用Google chrome浏览器并下载启用了跨域插件,下载网址https://www.loc.gov/item/2014514474/。。。试了好几次,都只能下载前200页的内容,能否帮忙测试一下,看下具体什么原因,谢谢!!!!

    @203347 回复 ⚑举报 

    未曾
    管理员

    @ccicc #203324

    我测试是正常的,您的代理服务器是不是不太理想?
    2026-01-22_085534
    ————
    为了避免中途中断重新开始的问题,新增了用户设定起始页的选项,您可以从失败的地方重新开始下载2026-01-22_090701

    @203350 回复 ⚑举报 

    未曾
    管理员

    新增

    宫内厅图书寮 - 链接提取与下载

    本工具为纯静态页面,浏览器会拦截对宫内厅 服务器的请求。
    请务必安装并开启 Chrome 插件: Allow CORS,开启教程可参见
    或者以禁用 Web 安全模式启动浏览器,否则下载会失败。
    等待链接获取完毕后,你可以复制链接到你自己的下载工具中下载。或直接使用网页在线打包下载。

    测试地址: tools.hanjihebi.com/gnt/
    2026-01-22_095701

    @203354 回复 ⚑举报 

    未曾
    管理员

    增加:

    网址链接批量生成器 (通用打包下载器)

    你可以通过规律生成批量的URL列表,也可以粘贴你需要批量下载的URL。然后打包下载~

    测试地址: tools.hanjihebi.com/url/

    @203467 回复 ⚑举报 

    谢耳朵
    游客

    哈哈我这几天还在想自己做一个,你已经实现了。

    可不可以集成到一个网页?根据网址决定后面的逻辑?

    另外是否考虑开源不同网站的解析、下载逻辑?这样大家都可以帮忙添加、维护新的网站。我最近刚刚帮bookget增加了甘肃图书馆和InternetArchive。

    @203469 回复 ⚑举报 

    未曾
    管理员

    @谢耳朵 #203467

    嗯,集成到一个网页是最终的逻辑~

    考虑到目前阶段是对各个适配,可能会有大量修改调整,一个个处理相对不容易出错。

    等测试到稳定期会整合集成到通过URL自动分析调用对应接口

    另外是否考虑开源不同网站的解析、下载逻辑?

    目前都是JS+HTML纯前端代码实现的。源码就是右键的源代码~

    @203484 回复 ⚑举报 

    未曾
    管理员

    将这些工具列表到一个网页了

    tools.hanjihebi.com/

    @203492 回复 ⚑举报 

    xiaopengyou
    游客

    @未曾 #203484

    登榜了,但建議直接用"下載工具實驗室",會不會比"小工具實驗室"一目瞭然一些?

    哈哈

    @203529 回复 ⚑举报 

    海鹰
    游客

    请教这种怎么批量下载?

    archive.aks.ac.kr/viewe...01-X000196

    @203687 回复 ⚑举报 

    CHEN
    游客

    增加古籍與特藏文獻資源 - 國家圖書館吗?这个站的用bookget-gui只能下载90页以内的,超过不能刷新翻页。

    @203957 回复 ⚑举报 

    当归黄芪
    游客

    @未曾  请教未曾,我的怎么获取不了呢-2-1

    @203961 回复 ⚑举报 

    未曾
    管理员

    @当归黄芪 #203957

    应该没启用配置(点亮左边的图标)

    打开扩展程序点击左边logo启动插件,变亮则已开启(默认是灰色的)

    003

    *如果平时不使用时请关闭插件(部分网站可能会引起冲突)

    @204171 回复 ⚑举报 

    剔藓扫尘
    游客

    国会

     

    请问未曾兄这是什么情况?安装的edge和firefox版都这样显示

    @204173 回复 ⚑举报 

    未曾
    管理员

    @剔藓扫尘 #204171

    Allow CORS插件安装启用了吗

    @204176 回复 ⚑举报 

    剔藓扫尘
    游客

    @未曾 #204173

    安裝啟用了(變成彩色)。

    剛試了360瀏覽器,也是如此。

    @204177 回复 ⚑举报 

    未曾
    管理员

    @剔藓扫尘 #204176

    你的浏览器能正常访问那个页面吗,没有人机验证

    我测试是可以正常下载的

    Screenshot_2026-02-04-18-53-34-855_com.android.chrome-edit

    链接:

    pan.baidu.com/s/1Nc...NtRZX4RXzA

    @204178 回复 ⚑举报 

    剔藓扫尘
    游客

    @未曾 #204177

    感謝未曾兄

    人機驗證後,打開網頁沒問題。

    但是點擊進去不能閱讀。(大概是這個問題?阅览

    @204179 回复 ⚑举报 

    未曾
    管理员

    @剔藓扫尘 #204178

    你的代理IP不太理想

    @204329 回复 ⚑举报 

    ihuang
    游客

    @未曾,为什么我上海图书馆下载都是0字节?

    @204333 回复 ⚑举报 

    未曾
    管理员

    @ihuang #204329

    请举例

正在查看 50 个帖子:1-50 (共 82 个帖子)
正在查看 50 个帖子:1-50 (共 82 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:【测试】几个在线资源下载工具
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1976年以后的资源需求或分享将会被清理删除。