已创建交流区回复
- 作者帖子
未曾管理员@崇鹂 #137657
那个xml前的名字和缩略图的名字是一样的。提取缩略图地址,批量替换一下就行~
可以使用EmEditor提取对于url,复制源代码到EmEditor
提取规则https://jsg.aks.ac.kr/jsgimg/thumb/(\d+)
如图
然后将提取的结果:替换》批量替换,规则为
查找
https://jsg.aks.ac.kr/jsgimg/thumb/(\d+)
替换为\1表示上面地址中正则的结果
https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/\1.xml
如图
得到结果
https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080153270.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080202506.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080213590.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080237451.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080249436.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080303953.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080322863.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080342352.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080400338.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080411808.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080425841.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080443253.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080504275.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080516839.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080531262.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080543892.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080555628.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080611649.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080625134.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080642682.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080700972.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080713005.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080726710.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080740695.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080752180.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080806369.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080824392.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080836221.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080854807.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080913423.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080926659.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080944273.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106080955805.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081009198.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081020245.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081044718.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081057687.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081112631.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081128727.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081141040.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081154182.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081207199.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081218732.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081231141.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081243410.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081257427.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081355378.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081410710.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081432529.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081451264.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081506331.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081518129.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081529789.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081543305.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081600284.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081616160.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081703273.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081716227.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081735854.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081747652.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081805502.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081820034.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081831785.xml https://jsg.aks.ac.kr/jsgimg/data/images/2021/11/06/dzi/20211106081849526.xml
然后可以使用批量下载的脚本获取
未曾管理员@yy #137645
不客气,等顺丰快递寄出后,我再短信告知您吧
未曾管理员
未曾管理员@xiaopengyou #137616
对于分享,我们目前还是鼓励的策略。或有些小心思,但也是文献开放传播的一种补充。标记一下即可
未曾管理员
未曾管理员@guozibaba #137586
修复了,感谢反馈
未曾管理员@芝清 #137551
这不是一个通用的缩放系统,只能自己建yaml文件拼
未曾管理员嗯,大陆地区目前只能挂代理下载了
未曾管理员
未曾管理员@leisure #137382
未曾管理员
未曾管理员
未曾管理员
未曾管理员
未曾管理员
未曾管理员@lee #137072
我再次测试正常,你换个浏览器试试
未曾管理员@小kleiber #137066
测试正常
未曾管理员@fwsh #136967
台北故宫书画600万像素(已去重和重命名),去重后大概大小1.15T
pan.baidu.com/s/1TN...Q?pwd=6666说明一下下载的图片文件名对应意义,依次文件名为例
例如:16__唐李昭道湖亭遊騎.軸故畫00000400000__K2A000004N000000000PAA其中16代表下载自网页
https://digitalarchive.npm.gov.tw/Painting/Content?pid=16&Dept=P
故畫000004代表台北故宫博物院藏品编号
K2A000004N000000000PAA代表台北故宫博物院数字图片编号(单个藏品可能包含多张数字图片)
其中包含:文件目录.txt 另外修订了一些原先下载的残损无效文件 更新于2024年5月5日
未曾管理员
未曾管理员@fwsh #136967
还没传完,估计今晚传完
未曾管理员@三姨仔 #136959
需要台湾身份+IP
未曾管理员硬着皮头读完一本,比如史记,应该就差不多了
未曾管理员@三姨仔 #136953
得有个台湾地区的人(身份)才行吧~
未曾管理员@隂晴万壑殊 #136951
不需要会员就能下载
未曾管理员@曉螃蟹 #136912
我已基本重命名完毕了,正在重新上传一份到百度网盘,上传完毕后会分享
未曾管理员@Ru_Evan #136877
哈哈,感谢先生~我换成bash脚本处理,对我来说还是bash容易些了
未曾管理员@hanhan999 #136765
珍宝馆的资源好像要买会员下载
未曾管理员
未曾管理员感谢先生分享
未曾管理员@Ru_Evan #136749
能力有限,因为涉及一对多的情况,需要循环套循环,我没写出来好的bat脚本。
未曾管理员
未曾管理员由于先前使用@Ru_Evan感谢脚本下载的图片(约2.5T),基于台北故宫的PID获取,这样的下载方式会产生大量重复文件。
因此,补一份 去重的版本:台北故宫书画600万像素(已去重和重命名),去重后大概大小1.15T
pan.baidu.com/s/1TN...Q?pwd=6666说明一下下载的图片文件名对应意义,依次文件名为例
例如:16__唐李昭道湖亭遊騎.軸故畫00000400000__K2A000004N000000000PAA其中16代表下载自网页
https://digitalarchive.npm.gov.tw/Painting/Content?pid=16&Dept=P
故畫000004代表台北故宫博物院藏品编号
K2A000004N000000000PAA代表台北故宫博物院数字图片编号(单个藏品可能包含多张数字图片)
更新于2024年5月5日
未曾管理员@大轩1234 #136673
直连的IP没了,在大陆地区只能挂代理下载了
未曾管理员@大轩1234 #136670
看了一下应该是以前的140.147.239.202直连美国国会的服务器失效了
未曾管理员@考拉 #136662
似乎今年大英图书馆改版后,好多以前在线的资源都没了~~
未曾管理员
未曾管理员@zswx #136632
因为未知原因导致上传的阿里盘的图片会出现重复文件,并重命名为(1)甚至(2)等等
未曾管理员
未曾管理员@atest #136627
我看了一下,阿里上传的文件重复率太高了,不知道是什么原因导致的~已删除了
其实我也是想放到阿里盘的,其一是号称不限速,其二是我的百度盘空间不太富裕了。但是没办法,上传到阿里盘的文件不知道为什么会多出一份。还是放到百度盘试试
未曾管理员
未曾管理员
未曾管理员
未曾管理员@dxx #136619
这个应该查找重复文件时删除了其中一个重复文件,剩下这个文件。但是确实是不重复的
未曾管理员@atest #136616
抱歉,已修订
- 作者帖子