标签: 

正在查看 50 个帖子:2,651-2,700 (共 2,786 个帖子)
  • 作者
    帖子
  • @180847 回复 ⚑举报 

    山寒
    游客

    @zhudw #180640

    这么一个强大的工具,就这样停止,实在是太可惜了

     

     

    @180863 回复 ⚑举报 

    古籍热爱学习者
    游客

    @zhudw #180733

    感谢先生!我们要和这些魔界人事做斗争,国家在恢复传统文化,古籍是最核心最基本的载体,这些坐拥公共文化财产的人的行径就不必多说,就是要靠着有道之人和这伙人作斗争,盼望继续更新研究新技术!!!

    @180894 回复 ⚑举报 

    zhudw
    游客

    @山寒 #180847

    @古籍热爱学习者 #180863

    没有完全停止,只是不跟进某些网站了,一更新就废的网站,就不更新了。

    趁着假期,再试试github.com/dewei...g/v25.0601

    前面你们讨论的那个网站,大概还能用 1 天。

    @180898 回复 ⚑举报 

    六祖坛经
    游客

    @zhudw #180733

    国图的人应该一直在盯着吧,所以感觉更新已经没有太大的意义了。

    @180902 回复 ⚑举报 

    世真
    游客

    支持!

    @180909 回复 ⚑举报 

    山寒
    游客

    也许咱们书格,某个人就是国图的,打四个字在这里,藏富于民!

    @180910 回复 ⚑举报 

    聿青
    游客

    个人认为如zhudw兄所言,现在中华古籍网站的操作非常中庸了:对于一个电脑知识匮乏的古籍爱好者可以动点脑筋就能一张一张的下载原图,又阻止了大批量下载给网站系统和工作人员造成的伤害。这样非常好。

    @180911 回复 ⚑举报 

    山寒
    游客

    @zhudw #180894

    先生太牛了!

    @180925 回复 ⚑举报 

    江南拙民
    游客

    @zhudw #180894

    @聿青 #180910

    从国图以前的“中华古籍资源库”和现在的“智慧平台”对比来看,明知bookget存在,“中华古籍资源库”放任下载,而现在的“智慧平台”屡屡改版,甚至访问速度稍快就封ip,可见国图是要竭力保护新平台。而书格这里明显已经被国图的人盯上了。当下这种情况就挺好的,起码还能存。担心一直更新的话,然后国图一直应对改版,别到最后连最原始的存图都不行,而只能截图,那就令人难受了。所以聿青说的有道理,现在的操作很中庸了。

    @180928 回复 ⚑举报 

    镜像之美
    游客

    希望大家都悠着点,细水长流才是

    @180929 回复 ⚑举报 

    江南拙民
    游客

    感觉现在不是大家下载细水长流的问题,而是国图要死保智慧平台,不能见到有可以单本批量下载该网站古籍图像的工具传播存在。不然也不会大动干戈前几天进行了大规模的改版:按作者zhudw的帖子分析,改版是进行了层层加码,连远程网址都不能在浏览器显示。

    @180931 回复 ⚑举报 

    江南拙民
    游客

    基于死保智慧平台这个出发点,那国图的逻辑应该是很清晰的:只要有批量下载的工具(哪怕单本),那肯定有一天网站数据会被薅完,而且不用太长时间就会被薅完。至于单张存图或者截图,这个肯定没法阻止,但这个速度肯定是慢到惊人,也就不会有人去薅网站的数据。

    @180941 回复 ⚑举报 

    黍离
    游客

    只是略有可惜,我一般下载后和网站搭配使用。往往需要的不是全书,而是某几节。通过网站找图片号码,再从下载文件里,快速浏览,能节省不少时间(网站一页页翻比较慢),还有浏览目录也是一样道理。话说回来,12000多部,需要内存至少12t,也没那么多内存。可惜的是后续新增的古籍名录里的宋元本,没法快速下载了。

    最后,自己动手,丰衣足食。我们想把古籍下载到自己手上,其实也是有备无患。而技术是一样道理,所以有时间的话我准备利用chatgpt学编程。

     

     

    @180946 回复 ⚑举报 

    江南拙民
    游客

    @黍离 #180941

    硬盘容量在现在这个时代,按说其实早已经不是什么问题。只是感觉国图肯定在盯着,所以必然见光死,更不更新意义不是太大。何必道增一尺,魔又增一尺,反倒导致国图改版期间,无法访问网站。

    @180955 回复 ⚑举报 

    百川归海山独秀
    游客

    请问犹他家谱下载不了了吗?试了最近几个bookget版本都不行

    @181004 回复 ⚑举报 

    fwsh
    游客

    和国图斗争

    @181009 回复 ⚑举报 

    zhudw
    游客

    @百川归海山独秀 #180955

    最近一个月的都是测试版,删改较多,不稳定。

    familysearch 重下 25.0601 版可以用。

    - 若某网站失效,会从wiki 中删除或标记为 ~~已失效~~

     

    @181016 回复 ⚑举报 

    百川归海山独秀
    游客

    www.familysearch.org/ark:/...39M-39WN-F

    不知道为什么下载到第58页就闪退了,6.2最新版本也是这样

    @181024 回复 ⚑举报 

    无限
    游客

    guji.sdlib.com/front/# ,山图分AB页PDF,要是开发一下就便利了

    @181026 回复 ⚑举报 

    zhudw
    游客

    @无限 #181024

    AB 页的方法可以参考:07--一些小技巧

    运行 bookget -m=1 会进入交互模式(双击运行后,随便输入不可识别的URL,也会进入交互模式)

    === 当前模式:图片批量下载 ===
    输入 'exit' 退出程序
    请输入图片URL模板(必须包含[PAGE],可选[VOL]和[AB]): 124.133.52.174:9009/res-b...BAB%5D.pdf
    请输入页码格式化位数(如04表示0001,03表示001): 04
    请输入起始册号: 0001
    请输入结束册号: 0006
    请输入全部册数的总页数: 1000

    即将开始下载:
    URL模板: 124.133.52.174:9009/res-b...BAB%5D.pdf
    册数范围: 0001-0006
    总页数: 1000
    页码格式: %004d
    扩展名: .pdf
    确认开始下载?(y/n): y

    @181027 回复 ⚑举报 

    zhudw
    游客

    @百川归海山独秀 #181016

    也许是内存溢出,电脑有32G内存,可能会好些。如果是必然现象好查原因,偶发不好查。

    @无限 #181024

    AB页再补充:

    http://此处省略/[VOL]/[PAGE][AB].pdf
    http://此处省略/[VOL]/[PAGE][AB].jpg
    http://此处省略/0001/[PAGE][AB].jpg
    一般是这样的URL模板就可以满足需求。
    @181029 回复 ⚑举报 

    学惭淹贯
    游客

    @zhudw #181027

    想请教一下大侠,智慧平台的“catalog”目录(书签)文件是如何获取到的啊?哪怕在阅读界面,html主体里也只是仅仅有目录(书签)文字本身,没有它们对应的页码啊。竟然能通过书籍介绍详情页就获取到页码对应的catalog目录,请教一下原理,是破解了网站的目录(书签)加密规则还是其他的情形啊?

    @181030 回复 ⚑举报 

    无限
    游客

    @zhudw #181026

    如狮子吼

    @181075 回复 ⚑举报 

    zhudw
    游客

    @学惭淹贯 #181029

    頁碼在 /api/anc/ancImageIdListWithPageNum 接口裏面。每個圖片一個imageId,對應一個pageNum

     

    @181107 回复 ⚑举报 

    昆仑星海
    游客

    新版本不會用了呢。是双击蓝色图标,然后粘贴网址吗?可以粘贴后就跳转到那个网页了,没有开始下载。1

    @181122 回复 ⚑举报 

    zhudw
    游客

    @昆仑星海 #181107

    你下载的只是 bookget-gui(那个蓝色图标) ,这是一个浏览器。还要下载 bookget.exe 放在同一个目录下。

    @181130 回复 ⚑举报 

    昆仑星海
    游客

    23

    是在上面那两个链接里下载吗?为何提示我没有访问权限呢。

    @181131 回复 ⚑举报 

    zhudw
    游客

    @昆仑星海 #181130

    github.com/deweizhu/bookget 这个是项目主页。要下载也必须从这个网址进去。

    屏幕截图 2025-06-03 183945

    @181138 回复 ⚑举报 

    昆仑星海
    游客

    为什么我粘贴了URL后点回车什么都没下载,又让我输入URL.谢谢1748953911307

    @181139 回复 ⚑举报 

    zhudw
    游客

    @昆仑星海 #181138

    你都打开 wiki了,可以看一下教程吗?wiki 列表中并没有你要下载的那个网站。

    那个网站只存在 bookget-gui 的教程中。08.bookget gui高级应用

    @181226 回复 ⚑举报 

    fwsh
    游客

    @zhudw #181139

    请问这个软件可以下视频吗?或者您给推荐一个好用的?谢谢

    @181332 回复 ⚑举报 

    zhudw
    游客

    @fwsh #181226

    看你实际需求了,如果是不管什么网站,只是探测视频URL。可以试试 firefox 浏览器的扩展 video downloadHelper addons.mozilla.org/zh-CN...oadhelper/

    如果是特定的网站,github上有一个开源项目 you-get github.com/soimort/you-get

    以上两种可跨平台。

    windows 下有一个IDM下载工具 www.internetdownloadmanager.com/

    是可以探测视频URL的。

     

    @181355 回复 ⚑举报 

    百川归海山独秀
    游客

    经反复测试显示这本书部分页面可以下载,部分页面下载就闪退(与内存等可能无关,我的是32G内存),第一次碰到这种情况。

    www.familysearch.org/ark:/...39M-39WN-F

    @181379 回复 ⚑举报 

    图图跑腿
    游客

    我今天下载两三个小时才下载了四五十张图片,显示为 1 it/min.这是网站限制下载速度吗?就是最近出的那个古籍平台。

    @181383 回复 ⚑举报 

    zhudw
    游客

    @百川归海山独秀 #181355

    你建两个空文档0057.jpg/0058.jpg,跳过这两个文件。可能是图源有问题,即使不闪退也无法下载。

    @图图跑腿 #181379

    正常应该是 20 it/min(一分种20张图),或许是你那边网络问题,原因不清楚。

    @181384 回复 ⚑举报 

    图图跑腿
    游客

    @zhudw #181383

    我平时下载速度都很快的,最快可以达到每秒100M,昨天速度也可以达到2M。今天就1-2It/min. 我今天是在中华古籍智慧化服务平台下载的,图源是国图,我试了一下直接在国图下就快的多多,但国图有水印。按这速度这本书得下一个月。

    @181385 回复 ⚑举报 

    图图跑腿
    游客

    @zhudw #181383

    直接在国图下速度50it/min

    @181386 回复 ⚑举报 

    黍离
    游客

    能下就不错了,之前bookget直接被封禁。和中华古籍资源库,没有可比性

    @181420 回复 ⚑举报 

    zhudw
    游客

    @图图跑腿 #181385

    中华古籍直接下载图片是加密处理的。如果你能直接下载,你就用你的方法。

    此软件我设置的 3 秒等待,一分钟 60 秒。这是在软件中限制的速度。理论最大值 20 张/分钟。

    @181427 回复 ⚑举报 

    图图跑腿
    游客

    @zhudw #181420

    好的,昨天夜间速度能达到每分钟15-20张图片,谢谢。

    @181491 回复 ⚑举报 

    fwsh
    游客

    @zhudw #181332

    再谢

    @181527 回复 ⚑举报 

    大牛哥
    游客

    这两天才在国图下了几本书,就被封了……现在进不去“古籍特藏”了,提示“403因权限问题或行为非法,您的访问被拒绝”。有和我一样的吗?

    @181576 回复 ⚑举报 

    欲为良医
    游客

    各位大神,日本东北大学狩野文库的书籍怎么下载,找不到下载的地方。

    @181624 回复 ⚑举报 

    zhudw
    游客

    @大牛哥 #181527

    台北那個古籍特藏?遇到IP受限,給你家光貓(PPPoE撥號)或 路由器(PPPoE撥號)斷電一次即可。

    @欲为良医 #181576

    日本大部分網站都是 iiif 標準,只要學會一個,其它的幾乎都能通用。

    見到這樣圖標 ,你就點,能點開就是鏈接。複製鏈接URL,粘貼到 bookget 最新版中,就能下載。

    如果沒有這樣圖標,就在書影頁面找找,一般都有 IIIF manifest URI類似這樣的字符。

    iiif-logo

     

    @181687 回复 ⚑举报 

    镜像之美
    游客

    @zhudw #181026

    大侠好!感谢您长期普惠大众!不知如下链接,可否下载:https://baike.baidu.com/item/%E5%AE%8B%E6%B9%98/17412

    再次拜谢!

    @181701 回复 ⚑举报 

    zhudw
    游客

    @镜像之美 #181687

    百度百科?是不是發錯了URL

    @181706 回复 ⚑举报 

    图图跑腿
    游客

    @zhudw #181624

    感谢🙏回头试一下。

    @181707 回复 ⚑举报 

    xiaopengyou
    游客

    @zhudw #181701

    他應該說的是台故宮的古籍資源。

    實際上只要有好梯子翻墻,台故宮有公開的資源都可以直接下載PDF檔,只是只能按台故宮的分冊檔逐一下,而無法一次下載全冊吧了。

    @181711 回复 ⚑举报 

    zhudw
    游客

    @xiaopengyou #181707

    這樣,我以為台北故宮閉站了呢,上次看還是幾個月前打不開了。

    @181720 回复 ⚑举报 

    镜像之美
    游客

    @zhudw #181711

    太感谢大侠了!给您添麻烦了!!!

正在查看 50 个帖子:2,651-2,700 (共 2,786 个帖子)
正在查看 50 个帖子:2,651-2,700 (共 2,786 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:bookget 开源了(更新至:v25.0701)
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1975年以后的资源需求或分享将会被清理删除。