正在查看 41 个帖子:1-41 (共 41 个帖子)
  • 作者
    帖子
  • @107687 回复 ⚑举报 

    世真
    游客

    考虑到小日子最近精神不大稳定,脑子经常抽风,而倭岛早稻田藏品丰盛,原计划先下载其它地区,看小日子妖风盛起。个人觉得先撸一下早稻田。今天咨询大神用BOOKGET 1.2.1下载方法。使用中发现多线程经常莫名闪断,单线程属实结果又慢(应该是主站的问题),于是想着多开GET是否好一些,结果发现GET同一程序重复运行挂不同连接也是可以的,而且下载在同一文件夹中。但因为网站的原因,个人觉得好象没什么效率。于是晚上和朋友一起研讨怎么下载比较方便,朋友说可以直接下载原PDF,经过测试,虽然网速垃圾,如果拿全地址至少能开到20线程同步(总速度约1.5MB/S,实属山田一龟)。。于是制作下载全PDF绝对地址目录就有点老大难了。早稻点的目录规则有明显的复式轮回方案。本人擅长使用函数,经过研究,发现可以通过EXCEL函数穷举它。已知最大个2200个PDF,已知早稻田全库共60825套。那么应该穷举下载次数为:2200*60825=133815000次(1.34亿)重点是可以批量挂机。

    公式思路如下:

    =$B$1&TEXT(ROW(A1),"0000")&"/"&RIGHT($B$1,LEN($B$1)-61)&TEXT(ROW(A1),"0000")&".pdf"

    图例如下:

    微信截图_20230826224625

    @107710 回复 ⚑举报 

    fwsh
    游客

    能用老百姓听得懂的语言介绍一下吗?

    @107729 回复 ⚑举报 

    HJS
    游客

    顶礼膜拜!估计十几个T的文件。

    @107735 回复 ⚑举报 

    xingzh
    游客

    @fwsh #107710

    统一用人类语言说话

    @107736 回复 ⚑举报 

    书画爱好者
    游客

    这年头,喜欢古文化的朋友没点数学基础,真的是望洋兴叹

    @107739 回复 ⚑举报 

    凡人
    游客

    推断出用穷举法算出全部文档网址,大神。准备洗库了吗。

    @107741 回复 ⚑举报 

    梅林
    游客

    @世真 #107687

    支持!必须支持!我一直担心小日子哪天下了海,老祖宗的心血没了!不能留形,留下象也好!可惜无大侠的本事!

    @107754 回复 ⚑举报 

    游客
    游客

    @世真 #107687

    已知最大个2200个PDF

    大侠,是哪部书2200个PDF呀?

     

    @107755 回复 ⚑举报 

    zheshijie
    游客

    牛逼,我在想全网公开的古籍资源会有多少,全下下来会有多大😄。说句公道话,日本的汉籍资源应该说做得最好的,不仅质量好,而且公开程度高,定个小目标,第一步先把日本的汉籍全部下下来吧😄

    @107806 回复 ⚑举报 

    散客
    游客

    各位大佬小日子的静嘉堂文库上面的古籍有办法下载吗?

    @107823 回复 ⚑举报 

    haha
    游客

    有没有高人具体的解释一下怎么操作啊 !

    @107824 回复 ⚑举报 

    散客
    游客

    各位大佬,小日子的静嘉堂文库上面的古籍有办法下载吗?

    @107827 回复 ⚑举报 

    半夏
    游客

    还有国立公文书馆,看到那些书都眼热!希望大佬全给干下来.只有收入国人手中才能得以流传.

    @107829 回复 ⚑举报 

    散客
    游客

    @半夏 #107827

    国立公文书馆可以直接下载,小日子的静嘉堂文库不知道怎么下载?

    @107830 回复 ⚑举报 

    世真
    游客

    @HJS #107729

    其实没有的,早稻田的资料有些很小

    @107832 回复 ⚑举报 

    世真
    游客

    @游客 #107754

    关键词 Jan. van. Eyl.

    发现看错了 1280

    @107833 回复 ⚑举报 

    世真
    游客

    @书画爱好者 #107736

    我数学渣,只是觉得肯定有更好的解决方案。就查函数表了

    @107834 回复 ⚑举报 

    世真
    游客

    @凡人 #107739

    计划洗了早稻田,我一直下美国国会,现在觉得应该重点转日本。

    @梅林 #107741

    小日子各库感觉百花齐发,每个站的构成都不同,需要大佬们支持,研究结构。

    @散客 #107806

    静嘉堂文库流出的不就那么多,还有很多没公开

    @半夏 #107827

    国立公文扒烂了吧,有老师扒的图片版本,说有20TB

     

    @107836 回复 ⚑举报 

    百花
    游客

    @世真 #107834

    美国国会的网站打不开啊,请问大佬怎么打开这个网站

    @107841 回复 ⚑举报 

    游客

    大力支持热血人士!技术能手护送古籍回家!

    @107842 回复 ⚑举报 

    世真
    游客

    @百花 #107836

    地区原因吧,我这边就是要验证,打开没问题

    @107849 回复 ⚑举报 

    百花
    游客

    @世真 #107842

    啥验证?啥验证?啥验证?

    @107856 回复 ⚑举报 

    世真
    游客

    @世真 #107842

    你不会不知道国会有人机识别验证的吧

     

     

    @107867 回复 ⚑举报 

    百花
    游客

    @世真 #107856

    大佬,这个真不会,求教?

    @107868 回复 ⚑举报 

    百花
    游客

    @世真 #107856

    美国国会这个网站,弄了很多次,都没有成功打开。求教大佬?

    @107878 回复 ⚑举报 

    百花
    游客

    @世真 #107856

    大佬,还在吗?求教大佬?

    @107887 回复 ⚑举报 

    医道昌隆
    游客

    为有心人点赞!

    @107908 回复 ⚑举报 

    世真
    游客

    @百花 #107868

    微信图片_20230828025156

    验证时,这个位置点一下就行了。如果再出现再点一次,每一次有效时间应该是半小时,半小时后需要重新验证。

    @108137 回复 ⚑举报 

    轩辕十四
    游客

    @世真 #107908

    书友好,俺有些看不懂,请教如何使用该方法?或者书友搞完该库,通知下俺,方便私聊,谢谢!

    @108379 回复 ⚑举报 

    江湖
    游客

    早稻田的书在2020年的时候就被人全库扒下来了,我记得14个T左右,当时没地方存,全删了。

    @108391 回复 ⚑举报 

    五湖
    游客

    @江湖 #108379

    我想知道是哪位大侠,这么厉害

    @108418 回复 ⚑举报 

    芥诚
    游客

    该馆文件清晰度有限   早些年下载过一点点  后来就没再关注了

    @108452 回复 ⚑举报 

    青松月冷
    游客

    恕我直言,你全部下载了就好像一头驴对着几十万平方公里的草料,没个鸟用。

    @108504 回复 ⚑举报 

    海晏河清
    游客

    @青松月冷 #108452

    草料多,驴就多了。

    @108508 回复 ⚑举报 

    世真
    游客

    @江湖 #108379

    其实我觉得是没有必要全下的,无奈朋友要全库,我就顺手挂机了。到时化汉籍的捡出来就行了

    @108511 回复 ⚑举报 

    世真
    游客

    @轩辕十四 #108137

    重点的几个代码拿完就行了,没必要全拿.

    以下目录代码的资料可以拿:

    Y01-Y09
    bunko01
    bunko08
    bunko17
    bunko19
    bunko31
    ha05
    he16
    he19
    he20
    ho03-ho05
    i01-i05
    i12
    i17
    na01
    ni01
    ni16
    nu07-nu09
    ri08
    ro12
    ro13
    ro14
    ru01
    ru02
    ru05
    wa04

     

    @108512 回复 ⚑举报 

    世真
    游客

    @芥诚 #108418

    下了就当备份了,反正还有几十TB的空间

    @108513 回复 ⚑举报 

    世真
    游客

    @海晏河清 #108504

    割草的没几个,驴倒是有一堆

    @108575 回复 ⚑举报 

    轩辕十四
    游客

    @世真 #108511

    收到,感谢!

    @117409 回复 ⚑举报 

    路途
    游客

    打包好了嗎,可以分享一下嘛

    @118968 回复 ⚑举报 

    時生
    游客

    請問書友能把日本各錧藏中文古籍全下載出來嗎

正在查看 41 个帖子:1-41 (共 41 个帖子)
正在查看 41 个帖子:1-41 (共 41 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:通过穷举法 打包日本早稻田 古籍全库!
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1973年以后的资源需求或分享将会被清理删除。