标签: 

正在查看 50 个帖子:2,551-2,600 (共 2,605 个帖子)
  • 作者
    帖子
  • @176919 回复 ⚑举报 

    摩诃
    游客

    使用 bookget.exe -i url.txt 的时候,用单线程,可以看到下载是按 url.txt 顺序下载。不过下载创建的目录名称,似乎是时间+随机数。目录名字的排序,和 url.txt 里面的顺序不完全一样。如果顺序一样的话,目录改名字就方便很多。

    www.digital.archives.go.jp_468e32a4610c6118c000063094010c60000318c4

    www.digital.archives.go.jp_468e32a4610c6718c000063094010c60000318c4

    www.digital.archives.go.jp_468e32ac210e7318c000063094010c60000318c4

    @176920 回复 ⚑举报 

    zhudw
    游客

    @摩诃 #176919

    如果只是一個網站(2022年第一版)時,是按網站的圖書編號存目錄的。

    隨着網站越加越多,這個工作量就會很大。

    加上有些人不自覺,會把某些網站當羊毛擼,全站下載搬到自己網盤或服務器,再提供給其他人。

    這導致,很多網站失效,我就再更新軟件修復。如此反復,浪費大量精力。

    後來就是一刀切,省時、省力。不管目錄了,並且有意讓目錄名稱是編碼後的,非人工可識別。

    工欲善其事,必先利其器。要想批量下人家網站,就讓他們學編程去吧。

    @176936 回复 ⚑举报 

    六祖坛经
    游客

    最新的源码,如果直接go build编译的话,好像有问题会报错。

    @176937 回复 ⚑举报 

    湛蓝
    游客

    @六祖坛经 #176936

    改了编译方式,不过cmake好像一样会报错

    @176955 回复 ⚑举报 

    摩诃
    游客

    @zhudw #176920

    理解、赞同。谢谢一直的无私分享。

    @176968 回复 ⚑举报 

    道统
    游客
    @176973 回复 ⚑举报 

    无限
    游客

    美国国会 现在不灵,用另外的方法,ok.daoing 获得url后,下载后顺序也是乱的

    @176990 回复 ⚑举报 

    小石头
    游客

    请教下,刚用最新版(25.0507)下载抗战平台的报纸图像,为啥下载的不是图档啊,如图,谢谢。

     

    微信图片_2025-05-08_145045_546

    @177007 回复 ⚑举报 

    镜像之美
    游客

    @zhudw #176920

    大侠好!今天25.0501已不能下载https://guji.nlc.cn/read/book?metadataId=1012047&imageId=8139375&searchKey=

    用更新的25.0507下载也失败360截图20250508175911036

    @177014 回复 ⚑举报 

    朱元璋
    游客

    @zhudw #176920

    首都图书馆也有很多重要资料放出,您是否会添加他们的下载呢?

    @177020 回复 ⚑举报 

    镜像之美
    游客

    @zhudw #176920

    大侠好!报告一下,更新的软件25.0507,较原25.0501增加了大量坏页,有的甚至不能下载https://guji.nlc.cn/read/book?metadataId=1012047&imageId=8139375&searchKey=

    原25.0501可惜失效,界面更简洁

    360截图49360截图84

    @177026 回复 ⚑举报 

    zhudw
    游客

    @六祖坛经 #176936

    编译的makefile是给机器人用的。人工执行 make release,需要在linux下。

    @无限 #176973

    美国国会需要海外IP,大陆目前没有办法下载。

    @道统 #176968

    图片类的不在我研究范围,这类不是IIIF标准的,都是要动手能力强的人才能下。

    @朱元璋 #177014

    未知的事情,无法回答你。自2024年1月16日以来,好像没有新加网站了。现在是做减法,遇到失效的网站,如果不是质量特别高的,一般会考虑删除。减轻维护的负担。

    @镜像之美 #177020

    503 明显是对方服务器不允许下载。有些图只显示半页,是国图服务器超负载了。

    @小石头 #176990

    抗日战争平台本来是隐藏的,不在wiki公布名单中,刚放出来。试试今天的版本吧。

    试试 25.0508 版,代码推送后,机器人已经发布了。

    @177035 回复 ⚑举报 

    剔藓扫尘
    游客

     

    @zhudw #177026

    目前最新0508替代之后,下载不成功,显示如下:

    求兄指点。

     

     

    截图

    @177036 回复 ⚑举报 

    zhudw
    游客

    @剔藓扫尘 #177035

    暂时先别下 guji.nlc.cn 该站服务器超负荷。

    @177138 回复 ⚑举报 

    未曾
    管理员

    @zhudw #177036

    先生辛苦。

    我有一个小建议,就是可以先生成一个包含分页图片URL的文件,然后下载根据这个文件下载。避免任务失败后,重新开始,每次都再去逐页获取API请求匹配链接。

    当然生成的URL文件也可以方便使用其他工具下载(我一般根据url列表使用wget单任务下载)。

    @177147 回复 ⚑举报 

    zhudw
    游客

    @未曾 #177138

    中华古籍智慧平台,现在出现503就是下载图片的URL,它其实也是java api,从参数看是通过java读取远程ftp的文件,再返回给客户端。压力的瓶颈还是图片URL接口。查询imageID的API 还没挂。

    目前在8号的版本,采用分卷下载,压力比1号的版本小一些。存 cache-urls.txt 之前也有想过,这样修改的版本还是要回到1号,一次查询完所有图片URL。

    其实只要使用者避开高峰期(下午和晚上),避免同一时间大量用户同时下载,就能解决问题。如果问题严重,我再考虑写cache urls,不过还是无法解决图片服务器的压力。最终压力还在这儿。

    @177148 回复 ⚑举报 

    未曾
    管理员

    @zhudw #177147

    感谢先生解惑。嗯,看来还是抓的人太多了。估计过了这段热乎劲就好了。

    其实还有个求稳的方案就是,把国图这个强制为单任务🤣

    @177173 回复 ⚑举报 

    明月清风
    游客

    @zhudw #175511

    湖南图搞定这个就行了

    1746774796493

    @177289 回复 ⚑举报 

    雲湖的雲
    游客

    强烈建议自发出来几个热心者,协调分工下载某某图书馆的某些书,不要大伙一窝蜂各个图书馆的都去下,造成拥堵。比如张三自发下载A馆的某些书,李四下载B馆的某些书,然后上传网盘,再在交流区贴出下载链接......这样会不会好很多?至少能减少或分流一些盲目的扒书流量吧......

    @177405 回复 ⚑举报 

    芥诚
    游客

    好奇试了一下  已被限制访问

    @177434 回复 ⚑举报 

    trywpl
    游客

    请问:新版本双击打开,闪一下就关了,是怎么一回事?谢谢

    @177523 回复 ⚑举报 

    六祖坛经
    游客

    @芥诚 #177405

    什么限制访问??中华古籍智慧平台吗??

    @177530 回复 ⚑举报 

    聿青
    游客

    傲游截图20250511202040

    @177546 回复 ⚑举报 

    六祖坛经
    游客

    @聿青 #177530

    那看来是下载得太狠了。

    @177565 回复 ⚑举报 

    芥诚
    游客

    @六祖坛经 #177546

    不是  我还没下载  今天只是试了一下  就直接封了   应该是只要用bookget就封

    @177640 回复 ⚑举报 

    Creen
    游客

    电脑上一按enter键就闪退是怎么回事啊?两台电脑都这样

    @177646 回复 ⚑举报 

    fwsh
    游客

    有卧底?

    @177669 回复 ⚑举报 

    zhudw
    游客

    请使用 2025-05-12 以后的发布版,即从 bookget 和 bookget-gui 下载的最新版,以此项目主页发布版为准。

    有防御的网站名单:

    [美国]国会图书馆
    [美国]哈佛大学图书馆
    [中国]香港中文大学图书馆
    [美国]familysearch.org 家譜圖像
    [中国]中华古籍智慧服务平台

    全文见:github.com/dewei...ookget-gui

     

    @177671 回复 ⚑举报 

    zhudw
    游客

    有闪退的用户,注意删除旧版所有文件。使用新版只有一个文件 bookget.exe (如果你电脑操作系统是中文用户名,或带有空格的用户名,也可能是这个原因)

    @177725 回复 ⚑举报 

    Creen
    游客

    @zhudw #177671

    十分感谢

    @177729 回复 ⚑举报 

    天忌
    游客

    2025-05-12_230521

    好久没用bookget,“请输入图片URL模板”是啥意思啊?国图都下载不了

     

     

    22222

    还有网站的页面也有问题。其它网站都正常,就书格出现这情况。请问是什么原因

    @177829 回复 ⚑举报 

    zhudw
    游客

    @天忌 #177729

    用 12 日的版本,1 号的版本问题很多。

    如果输入的URL不可识别,会进入图片批量模式,如需回到原来的模式,关闭软件重新打开即可。

    ————

    书格,我这边看是正常的。可能是你访问的时候, 某些CSS文件没有加载。

    @177830 回复 ⚑举报 

    大道至简
    游客

    @zhudw #177829

    大佬打开bookget-gui 出现错误怎么解决1747104202793下载 的最新版

    @177844 回复 ⚑举报 

    zhudw
    游客

    @大道至简 #177830

    下载VC++运行库,安装即可,所有C++程序通用的。

    aka.ms/vs/17...st.x64.exe

    @177899 回复 ⚑举报 

    书不在多少
    游客

    今天还能见到五百年前、一千年前的书,实在是我辈之幸,古籍今日仍拥有如此众多的读者,同样也是古籍之幸,非常感谢推动此次珍贵古籍高清发布的人。有点“古籍重光”的味道吧。

    @177989 回复 ⚑举报 

    六祖坛经
    游客

    @zhudw #177829

    05.12版本,在智慧平台上面即便下单册也不行,没下几页bookgui浏览器就不行了。

    @178013 回复 ⚑举报 

    zhudw
    游客

    @六祖坛经 #177989

    bookget-gui 解决的是CDN防御问题,但不能解决限IP。也不能解决

    500 Internal Server Error,你们悠着点儿啊,不要逮着一只羊撸,其它站的资源不是也有么。

    屏幕截图 2025-05-14 141307

    @178057 回复 ⚑举报 

    zhudw
    游客

    补充更新:

    本文面向会一些 javascript 编程的用户,自己动手,一切皆有可能!

    这个实现只需要 bookget-gui 即可完成所有功能,不需要 bookget。

    全文教程看:08.bookget gui高级应用

    github.com/dewei...i/releases

    使用示例

    打开 bookget-gui 输入URL,访问你想浏览的网站,例如: https://rbook.ncl.edu.tw
    此时,就像平常使用其它浏览器一样,丝毫没有差别。点击想看的图书,完成【验证码】真人验证。
    当你可以看到书影的时候,软件已经开始自动下载,查看 downloads 文件夹,就可以看到图片了。
    你不用操作,软件会自动翻下一页。

    如下图所示:

    屏幕截图 2025-05-14 160013

     

    @178069 回复 ⚑举报 

    黍离
    游客

    @zhudw #178057

    请问,我按照bookget-gui,下载Microsoft Visual C++运行库,安装之后,提示要修复安装,然后重启。重启后,依旧提示要修复安装。反复循环,卡在这一步了(我是win11)。我也正在小红书和B站上学习安装,但感觉遇到的问题都不一样。请问有解决办法吗?

    @178070 回复 ⚑举报 

    黍离
    游客

    抱歉,不用了。我陷入了误区,以为要能打开c++运行库才行。刚刚发现bookget-gui可以正常下载(之前没用过,第一次用)。请忽略我上面一条帖子。

    @178073 回复 ⚑举报 

    以前那些阻碍的人,应当判刑
    游客

    @zhudw #178057

    先生好,为何我按照指点,把https://guji.nlc.cn/read/book?metadataId=1011136&imageId=7158481&searchKey=   放到gui的上面,也的确一页一页的翻,也的确在download中有,但是只有第一页显示,而其余缩略图的不显示,也打不开。

     

    敢问,是何原因

     

    微信截图_20250514191402

    @178077 回复 ⚑举报 

    zhudw
    游客

    @以前那些阻碍的人,应当判刑 #178073

    你把不能显示的图片,改成.txt,用记事本看看里面是什么。有可能是服务器500错误。等服务器稳定再试。

    @178085 回复 ⚑举报 

    古籍热爱学习者
    游客

    @zhudw #178077

    文件比较大,都好几兆一个。我改成txt,是各种三角之类的乱码。

    @178092 回复 ⚑举报 

    zhudw
    游客

    @古籍热爱学习者 #178085

    大文件,且不是文本,应该还是图片(或是残图)。删掉下次再试一次。《小学五卷》我试了可以。

    屏幕截图 2025-05-14 212334

     

    @178096 回复 ⚑举报 

    古籍热爱学习者
    游客

    @zhudw #178092

    多謝,看了您的圖片,一下子明白了,原來按照您的網址才是正確的。

    @178260 回复 ⚑举报 

    大道至简
    游客

    @zhudw #178092

    大佬bookget-gui 卡顿之后有的会漏下,必须删掉重新下载 。能否设置跳过已下载从断页处开始继续下载?

     

    @178266 回复 ⚑举报 

    zhudw
    游客

    @大道至简 #178260

    假如,一本书有1000页,你下到 500 页中断了。可以把已下载的文件,移到单独的文件夹下。

    剩下的 500 页,重新翻页的时候,你可以在网页上跳转到第 500 页开始翻页。

    bookget-gui 的视角:来了一张图,按顺序存下它。再来一张图,再存下它。就这样简单反复工作。它不是一个下载工具,就只是edge浏览器的马甲。

     

     

    @178269 回复 ⚑举报 

    白身
    游客

    如果可以制定起始页就好了

    @178271 回复 ⚑举报 

    大道至简
    游客

    @zhudw #178266

    好的 谢谢大佬

    @178280 回复 ⚑举报 

    zhudw
    游客

    @白身 #178269

    如果你会 javascript ,我可以让 bookget-gui 支持页面加载完,执行你的脚本。

    在你的脚本里面,你可以实现想要的功能,例如页面加载完,你就让它跳转到上次关闭时的页码。

    至于,我为什么不写好,因为不想再造一个类似 bookget 的工具也来,那样没有意义。我一个人维护的网站有限,无法面对整个网络的图书馆,并且他们会升级的。一升级就失效,是个死循环。

正在查看 50 个帖子:2,551-2,600 (共 2,605 个帖子)
正在查看 50 个帖子:2,551-2,600 (共 2,605 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:bookget 开源了(更新至:v25.0512)
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1973年以后的资源需求或分享将会被清理删除。