正在查看 15 个帖子:1-15 (共 15 个帖子)
  • 作者
    帖子
  • @51643 回复 ⚑举报 

    pizinet
    游客

    例如:commons.wikimedia.org/wiki/...0%E9%83%A8

    我都是需要单独打开页面,然后获取每一个pdf的地址,不知是否能够有批量获取下载地址的方法。

    哪位兄台知道的还望赐教,感谢!

    @51660 回复 ⚑举报 

    吃饺子不沾醋
    游客

    这个网站批量下载时间长了会被封ip的

    @51661 回复 ⚑举报 

    pizinet
    游客

    @吃饺子不沾醋 #51660

    我需要的是批量获取下载地址的方法。

    至于批量下载,可以另外分批。而且,目前并没有遇到封IP的情况。

    @110510 回复 ⚑举报 

    zhaogq1989
    游客

    楼主,请问您找到方法了吗?

    @110533 回复 ⚑举报 

    j
    游客
    @110555 回复 ⚑举报 

    青林
    游客

    @pizinet #51643

    这个站我刚刚下了一本书,你搜索所需的书点开后往下拉,点开书籍复制地址用bookget可以下了

    @110556 回复 ⚑举报 

    游客
    游客

    维基文库这个网站咋打不开,请问是不是要梯子才能打开???

    @110603 回复 ⚑举报 

    游客

    有的版本谷歌瀏覽器無需任何技術可順利打開維基文庫在線頁面

    也可用kiwix同步數據庫離線閱讀

    134030

    ………………………………

    1479961

     

     

     

    @110628 回复 ⚑举报 

    游客

    也可以試試這個地址看看:

    https://zh.m.wikisource.org/wiki

    純文字在線閱讀的,沒有pdf

    175900

    @110635 回复 ⚑举报 

    青林
    游客

    点开可以直接用IDM下载,也可以用下载器下载

    @110638 回复 ⚑举报 

    张飞白
    游客

    通过观察,可以发现每一本书的可下载的pdf的链接长这样子

    1

    由于链接中间有不同的字符及文件名也不一样,所以不能用规律生成

    我们想办法看看网页源代码中有没有线索

    2

    3

    可以发现还是有线索的,虽然不太一样,但后续可以处理的。将这些全部代码复制,放到emeditor软件中

    4

    本人的正则表达式不太灵光,不过好歹能用

    upload.wikimedia.org/wikip...s/thumb(.* ?).pdf

    使用这个正则表达式匹配,然后点提取。(注意提取选项中要选择“仅显示匹配的字符串”)

    @110640 回复 ⚑举报 

    张飞白
    游客

    设置好后,点提取,提取的内容在新窗口如下

    再按ctrl+h,弹出替换窗口,准备替换

    通过观察上面,发现现在提供的内容,比目标链接多了“/thumb/”,按下图中设置,然后点“全部替换”把它替换掉即可

    5

    替换后如下

    6

     

     

    @110641 回复 ⚑举报 

    张飞白
    游客

    最后,拿出任意一个链接来,测试下,是可以返回pdf的。说明操作正确,没有问题

    10

    最最后,把这些链接拿到其他软件上,就可以批量下载了。

    @110645 回复 ⚑举报 

    游客

    頁面有介紹批量下載方法

    切莫不限制線程、不限制速度,將服務器下載崩了

    QPbRGifR2J

    >>>>>

    746044

    @110830 回复 ⚑举报 

    简明
    游客

    感谢

正在查看 15 个帖子:1-15 (共 15 个帖子)
正在查看 15 个帖子:1-15 (共 15 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:求助维基文库如何批量获取下载地址?
您的信息:



发帖/回帖前,请了解相关版规

1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1973年以后的资源需求或分享将会被清理删除。