标签: 优质分享
- 作者帖子
山寒游客
古籍热爱学习者游客@zhudw #180733
感谢先生!我们要和这些魔界人事做斗争,国家在恢复传统文化,古籍是最核心最基本的载体,这些坐拥公共文化财产的人的行径就不必多说,就是要靠着有道之人和这伙人作斗争,盼望继续更新研究新技术!!!
zhudw游客@山寒 #180847
@古籍热爱学习者 #180863
没有完全停止,只是不跟进某些网站了,一更新就废的网站,就不更新了。
趁着假期,再试试github.com/dewei...g/v25.0601
前面你们讨论的那个网站,大概还能用 1 天。
六祖坛经游客@zhudw #180733
国图的人应该一直在盯着吧,所以感觉更新已经没有太大的意义了。
世真游客支持!
山寒游客也许咱们书格,某个人就是国图的,打四个字在这里,藏富于民!
聿青游客个人认为如zhudw兄所言,现在中华古籍网站的操作非常中庸了:对于一个电脑知识匮乏的古籍爱好者可以动点脑筋就能一张一张的下载原图,又阻止了大批量下载给网站系统和工作人员造成的伤害。这样非常好。
山寒游客@zhudw #180894
先生太牛了!
江南拙民游客
镜像之美游客希望大家都悠着点,细水长流才是
江南拙民游客感觉现在不是大家下载细水长流的问题,而是国图要死保智慧平台,不能见到有可以单本批量下载该网站古籍图像的工具传播存在。不然也不会大动干戈前几天进行了大规模的改版:按作者zhudw的帖子分析,改版是进行了层层加码,连远程网址都不能在浏览器显示。
江南拙民游客基于死保智慧平台这个出发点,那国图的逻辑应该是很清晰的:只要有批量下载的工具(哪怕单本),那肯定有一天网站数据会被薅完,而且不用太长时间就会被薅完。至于单张存图或者截图,这个肯定没法阻止,但这个速度肯定是慢到惊人,也就不会有人去薅网站的数据。
黍离游客只是略有可惜,我一般下载后和网站搭配使用。往往需要的不是全书,而是某几节。通过网站找图片号码,再从下载文件里,快速浏览,能节省不少时间(网站一页页翻比较慢),还有浏览目录也是一样道理。话说回来,12000多部,需要内存至少12t,也没那么多内存。可惜的是后续新增的古籍名录里的宋元本,没法快速下载了。
最后,自己动手,丰衣足食。我们想把古籍下载到自己手上,其实也是有备无患。而技术是一样道理,所以有时间的话我准备利用chatgpt学编程。
江南拙民游客@黍离 #180941
硬盘容量在现在这个时代,按说其实早已经不是什么问题。只是感觉国图肯定在盯着,所以必然见光死,更不更新意义不是太大。何必道增一尺,魔又增一尺,反倒导致国图改版期间,无法访问网站。
百川归海山独秀游客请问犹他家谱下载不了了吗?试了最近几个bookget版本都不行
fwsh游客和国图斗争
zhudw游客
百川归海山独秀游客www.familysearch.org/ark:/...39M-39WN-F
不知道为什么下载到第58页就闪退了,6.2最新版本也是这样
无限游客guji.sdlib.com/front/# ,山图分AB页PDF,要是开发一下就便利了
zhudw游客@无限 #181024
AB 页的方法可以参考:07--一些小技巧
运行
bookget -m=1
会进入交互模式(双击运行后,随便输入不可识别的URL,也会进入交互模式)=== 当前模式:图片批量下载 ===
输入 'exit' 退出程序
请输入图片URL模板(必须包含[PAGE],可选[VOL]和[AB]): 124.133.52.174:9009/res-b...BAB%5D.pdf
请输入页码格式化位数(如04表示0001,03表示001): 04
请输入起始册号: 0001
请输入结束册号: 0006
请输入全部册数的总页数: 1000即将开始下载:
URL模板: 124.133.52.174:9009/res-b...BAB%5D.pdf
册数范围: 0001-0006
总页数: 1000
页码格式: %004d
扩展名: .pdf
确认开始下载?(y/n): y
zhudw游客
学惭淹贯游客@zhudw #181027
想请教一下大侠,智慧平台的“catalog”目录(书签)文件是如何获取到的啊?哪怕在阅读界面,html主体里也只是仅仅有目录(书签)文字本身,没有它们对应的页码啊。竟然能通过书籍介绍详情页就获取到页码对应的catalog目录,请教一下原理,是破解了网站的目录(书签)加密规则还是其他的情形啊?
无限游客@zhudw #181026
如狮子吼
zhudw游客
昆仑星海游客新版本不會用了呢。是双击蓝色图标,然后粘贴网址吗?可以粘贴后就跳转到那个网页了,没有开始下载。
zhudw游客@昆仑星海 #181107
你下载的只是 bookget-gui(那个蓝色图标) ,这是一个浏览器。还要下载 bookget.exe 放在同一个目录下。
昆仑星海游客是在上面那两个链接里下载吗?为何提示我没有访问权限呢。
zhudw游客
昆仑星海游客为什么我粘贴了URL后点回车什么都没下载,又让我输入URL.谢谢
zhudw游客
fwsh游客@zhudw #181139
请问这个软件可以下视频吗?或者您给推荐一个好用的?谢谢
zhudw游客@fwsh #181226
看你实际需求了,如果是不管什么网站,只是探测视频URL。可以试试 firefox 浏览器的扩展 video downloadHelper addons.mozilla.org/zh-CN...oadhelper/
如果是特定的网站,github上有一个开源项目 you-get github.com/soimort/you-get
以上两种可跨平台。
windows 下有一个IDM下载工具 www.internetdownloadmanager.com/
是可以探测视频URL的。
百川归海山独秀游客经反复测试显示这本书部分页面可以下载,部分页面下载就闪退(与内存等可能无关,我的是32G内存),第一次碰到这种情况。
图图跑腿游客我今天下载两三个小时才下载了四五十张图片,显示为 1 it/min.这是网站限制下载速度吗?就是最近出的那个古籍平台。
zhudw游客
图图跑腿游客@zhudw #181383
我平时下载速度都很快的,最快可以达到每秒100M,昨天速度也可以达到2M。今天就1-2It/min. 我今天是在中华古籍智慧化服务平台下载的,图源是国图,我试了一下直接在国图下就快的多多,但国图有水印。按这速度这本书得下一个月。
图图跑腿游客@zhudw #181383
直接在国图下速度50it/min
黍离游客能下就不错了,之前bookget直接被封禁。和中华古籍资源库,没有可比性
zhudw游客
图图跑腿游客@zhudw #181420
好的,昨天夜间速度能达到每分钟15-20张图片,谢谢。
fwsh游客@zhudw #181332
再谢
大牛哥游客这两天才在国图下了几本书,就被封了……现在进不去“古籍特藏”了,提示“403因权限问题或行为非法,您的访问被拒绝”。有和我一样的吗?
欲为良医游客各位大神,日本东北大学狩野文库的书籍怎么下载,找不到下载的地方。
zhudw游客
镜像之美游客
zhudw游客@镜像之美 #181687
百度百科?是不是發錯了URL
图图跑腿游客@zhudw #181624
感谢🙏回头试一下。
xiaopengyou游客
zhudw游客@xiaopengyou #181707
這樣,我以為台北故宮閉站了呢,上次看還是幾個月前打不開了。
镜像之美游客@zhudw #181711
太感谢大侠了!给您添麻烦了!!!
- 作者帖子