- 作者帖子
戚少保游客注意到有的博物馆网站上图片网址基本都是一个格式,后面是用数字编号排序的(比如编号从000328到001028这样的),一张张找来下载实在很费时间。我不是很懂程序之类的,想请教一下书格的各位有没有什么工具可以批量下载这种用数字排序的同一类网址的图片?谢谢
xiaopengyou游客
戚少保游客@xiaopengyou #150987
谢谢帮助!这个生成器确实能省下不少时间,不过要是想自动一次性下载很多张图片的画是需要导入到什么程序里面吗,或者是要用IDM?
xiaopengyou游客@戚少保 #150991
如果確認圖片的URL都是有遞增的規律,個人都是直接用IDM批量下載,只是IDM 一次只能下載999張,而且IDM只有一個月的免費使用期,過後就只能付費。
xiaopengyou游客@戚少保 #150991
您也可以用URL生成器取得全部的URL,再去IDM下載的。
戚少保游客@xiaopengyou #150995
好的,非常感谢,刚刚试了一下用IDM下载是可以直接复制粘贴批量下载,谢谢您的帮助!
风之痕游客可以找到下载链接规律,用python写爬虫自动爬取。如果前面的地址不变,只有图片名称有规律的递增,可以用IDM或者迅雷批量下载。
xiaopengyou游客@戚少保 #150986
另外您也可以試著找有無 IIIF MANIFEST 的網址,copy iiif manifest網址到bookget下載,就可能會下載到高清大圖的資源。反正也與我一樣不懂程序技術,有高人無償分享的下載工具,就多方試試唄。
bookget的教程:
IIIF是一种业界标准,凡使用此标准的网站,都有提供IIIF Manifest 链接,如哈佛大学、牛津大学等图书馆。适用性更广, 理论上所有支持IIIF的图书馆都可以下载。
野草游客我都是用AI写一个python脚本下的,就是有时候爬取会丢一些页数。后面又让AI写了扫描文件夹下缺失的文件名,可以迅速定位少了哪些文件,再拿前面那个脚本爬取缺失的文件。
- 作者帖子
正在查看 9 个帖子:1-9 (共 9 个帖子)
正在查看 9 个帖子:1-9 (共 9 个帖子)
正在查看 9 个帖子:1-9 (共 9 个帖子)