标签: 优质分享
- 作者帖子
镜像之美游客@世真 #101850
单本就是这样
岱阔游客@zhudw 试了试还是不会添加网站,术业有专攻啊。还得麻烦先生帮忙添加一个:
越南汉喃古籍文献典藏数位计划https://lib.nomfoundation.org/collection/1/,用F12找URL是可以IDM下,但是多了就有点累,还是先生这个神器来的简单。想自己添加在源文件上试了几次都不行,只有麻烦您了!感谢!
岱阔游客或者把哥伦比亚大学一起加上也好https://search.library.ubc.ca/。抱拳
QiangWeihua游客我是在今年山西晋城的一个讲座上得知这个软件的,利用它(当时是1.16版)下载了不少hathitrust上仅能查询的书,可惜后来不能下载了。最近在尝试下载国图资源的时候,发现下面的这本书(科学文库里的)可以全文浏览,但不知如何下载,请各位指点一下,谢谢。
vpn2.nlc.cn/prx/0...le/list.do
再次感谢zhudeiwei大侠!
QiangWeihua游客
太鳦游客@岱阔 #101959
兄台在哥伦比亚大学讀書?那個好像要登入才可看得到電子古籍
三河游客@镜像之美 #101497
thanks
古籍爱好者游客大侠能不能更新一下下载hathitrust上仅能查询的书,现不能下载了。
zhudw游客bookget v1.2.1
[更改]国图支持”对照阅读“矢量图书
[新增]越南汉喃古籍文献友情提示:
使用中可能会造成各种心情不愉快,软件不是那么好用。
作者本人拒绝「负能量」,各种烦燥、负面情绪,请使用者自己消化。天下间没有容易的事。————————————————————————————————————————————————————————
@大道至简 #101902
香港中文建议用 Windows 下载,可以到 wiki上看一下文档,有更新说明。
@古籍爱好者 #102041
hathitrust 没有办法下载「仅能查询」的图书。
@QiangWeihua #101976
vpn2.nlc.cn 大概是国图授权登录第三方平台的跳转,不是国图自有的图书,不能下载。
@岱阔 #101959
search.library.ubc.ca 的图书好像是跳转到hathitrust 的,我看了几本都这样。
镜像之美游客@zhudw #102260
感谢大侠的付出,我急躁了一些,深表歉疚!1.21版大大改善,且暂时没有坏页,太了不起了!!!
遊客游客
zhudw游客@遊客 #102270
有真人验证,需要浏览器执行javascript,通过真人验证后,才可以发送http get
小逻辑游客@zhudw #80138
有没有可能设计成可以选册数下载的,比如宫内厅的大藏经6264帖,如果之前下到100帖,下次再下载可以不用跳过之前的100帖,直接选101开始。或者想下载其中的203至300,可以直接选,而不用全部下载跳过去。遇到册数多的书还是能选择册数比较好。谢谢
zhudw游客@小逻辑 #102324
大藏经,书格已有归档。
特殊需求,需要使用者学习一下终端命令。详见:learn.microsoft.com/zh-cn...rshell-7.2
这里以大藏经为例,写一个powershell 终端运行的例子:
#在powershell 中粘贴以下命令,可下载大藏经第100-110册。余仿此。 for ($i = 100; $i -lt 110; $i++) { bookget -vol="$i" "https://db2.sido.keio.ac.jp/kanseki/T_bib_frame.php?id=007075" }
遊客游客@镜像之美 #101576
建议按需下载,避免短期内集中批量下载,同一 ip 集中批量下载会给图源站点服务器造成大负荷,这本身就是一件惹眼的事情,稍有经验的网站管理员可以轻易识别到。
在某一图源如确有大量下载需求,也应分批次、尽可能分散时间来进行下载,若一时过度贪求囤积,或可引起对方网站管理员升级网站限制措施,如降低图源质量、加强连接限制等等措施,长远来看是不利的。
短期内集中大批量下载,是明显超出一个普通人研究学习的需求的,请斟酌行事。
遊客游客为了共同的图源下载生态,希望其它书友也能注意到这个问题。
按需下载,避免短期内集中批量下载。确有大量下载需求,也应分批次、尽可能分散时间来进行下载。
遊客游客@zhudw #102292
感謝大佬指教!
小逻辑游客@zhudw #102329
感谢。大藏经我已经下载。就是举个例子。谢谢!
yngwie游客@zhudw #102260
zhudw老师,请问一下hathitrust下载问题。网站最近好像改版,查询的图书链接跟软件支援的格式不同,所以便不能下载。比如下面这本:https://babel.hathitrust.org/cgi/pt?id=uc1.%24c154621&seq=1
这本是可以线上浏览的,照例可以用软件下载,不过,今天试了几次,都没成功。再麻烦您有空时看看。谢谢!
叶片游客美国hathitrust网站今天怎么下载不了,是不是网站不稳定或者新的限制。用bookget等无法下载。请高人指点。谢谢!
zhudw游客@yngwie #102466
这个我没法测试。只能看到 This item is not available online
另外,这个网站改版后,确实不能下载了。晚上会更新一下1.2.1发布包,你晚点重下载试试。
yngwie游客@zhudw #102518
谢谢您!提供的样本原先也没法看到,换了ip 才能在线上浏览,不过,这种法子好像只限于部分书籍,无法一体适用。
apple游客@zhudw #102329
THANKS for you
曾斌游客@zhudw #80138
hathitrust昨天还能下载,今天hathitrust改版,bookget不能下载了,怎么办呢?网页还能访问,应该不是被封ip吧。
书缘2023游客请教各位,说明文档里的命令从哪里输入啊
送你离开千里之外游客@书缘2023 #102637
直接终端里输入就可以调取下载命令,不知具体指的什么
zhudw游客@叶片 #102506
@曾斌 #102623
hathitrust 的问题,需重下1.2.1版(昨晚有更新)。
@书缘2023 #102637
终端运行软件,需要先配置环境。参考文档:03 安装 bookget 环境
配好以后,在【开始菜单】中找 【终端、或命令提示符、或powershell】(不同电脑不一样,有哪个用哪个),打开后,输命令bookget 即可调用程序(也可以在bookget后加一些参数,详见wiki 08高级命令参数)。
yngwie游客@zhudw #102518
谢谢zhudw老师更新软件,目前测试下载正常。不知道是软件,或是网站改版的原因,下载缺页状况没再出现,比以前大大改善。感谢!
北文游客不知您能否添加[韩国]国立历史研究所的朝鲜王朝实录呢
书缘2023游客@送你离开千里之外 #102645
感谢感谢,阅读理解没做好☺
书缘2023游客日本公文书馆网站上提供jpg、jp2、pdf三种格式下载,用bookget可不可以直接下载pdf格式呢
zhudw游客@书缘2023 #103430
有自定义参数 -ext 可以指定下载的文件类型〔终端运行 bookget 后面加参数〕,例如:bookget -ext=".jp2" 或者 -ext=".pdf"
世真游客@镜像之美 #101916
单本很少断,没遇到下不动的情况,随机倒是很容易造成闪退
世真游客@zhudw #103475
请问下大佬,日本 東京大学学術資産 da.dl.itc.u-tokyo.ac.jp
GET下载的命名规则是什么,我表示没看懂,资料下载了没法批量一一对应命名。
如:
da.dl.itc.u-tokyo.ac.jp/porta...ormat=json
司马老贼游客@zhudw #103475
建议下载的时候文件夹的名称随机uuid生成,这样批量下载的时候无法对应书的名称,以减少大家批量下载!
遊客游客总有那么一些人,他们贪婪无度,胃口比太平洋大。
动辄整库盘下。
火力全开,死命下载,每次下载不到被动断开不罢休。他们只顾自己舒服,对后来者可能造成的获取困难(升级限制),是心中明了的,却仍然我行我素。
他们自己享有的便利是别人给的,却从不考虑给别人便利,有多宽的道占多宽的道,最好让他人无路可走。
人性是无法靠自我约束的,它必须靠外力约束
建议楼主@zhudw 考虑施加约束,使得软件既能满足普通人研究学习的需求,又能阻止那部分人野蛮囤积。
xiaopengyou游客
xingzh游客@xiaopengyou #103758
“臣附议”,不然无法满足!
遊客游客说明:在下并不反对囤积的行为,抨击的是死命下载,每次下载不到被对方服务器被动断开连接不罢休的行为。
即使要盘下整库,可否自己制定一个合理适度的下载计划?如,同一图书馆,规划性的,一年,或更长时间的分散下载,是完全可行的,它需要的只不过是一些耐心,哦,对了,还有节操。
那部分人的念头是 “最短时间内盘下整库,最好千兆带宽满载满速下载,最好立马完成,一个月已是急不可耐……”
这样的 弓虽 暴 式 下载,恕我直言,寡廉鲜耻,毫无节操。@xiaopengyou #103758
断更对后来者不公平,个人建议可在新版施加约束,并删除前期版本。
向前游客科學在發展,技術在進步,不能因為您個人的硬件原因如存儲容量過小、網絡帶寬過低等原因而去阻礙技術的發展,您真正應該改善的是怎麼提高您個人的硬件配置去適合科學技術的發展
技術就是應該怎麼讓技術發揮最大的作用才是真正的技術
bookget就是一種技術,就應該讓bookget發揮出更大的作用才是真正體現出bookget的技術價值,而不應該去局限bookget的技術作用
子坚游客
遊客游客@向前 #103763
是你理解能力不足,还是我表达能力差?哪里涉及到硬件配置了??
前面说明了,我并不反对囤积的行为,抨击的是,每次下载不到被动断开连接不罢休的行为。这种行为或可引起对方网站管理员升级网站限制措施。确有大量下载需求,分批次、尽可能分散时间来进行下载,是没有问题的。
我此前也提出过 短期内集中大批量下载 这个问题 @遊客 #102337
遊客游客@子坚 #103770
正因为人性是无法靠自我约束的,所以它才必须靠外力约束。
xiaopengyou游客@遊客 #103760
哈哈,大概猜得到哪些人用bookget扒庫。
斷更,並不影響後來者的使用,不斷對升級藏館防御的更新,只是讓LZ費心費力而已
國外的一些圖書館本身也多能直接下載,無須使用bookget的,甚至韓國圖有公開的資源,還只能舊版的某一版本才能使用..
工具是沒錯的,重點還是在使用者,人心不足蛇吞象吧了
世真游客呵呵
dxxx游客這也費心那也費力,還會有進步嗎?
遊客游客@向前 #103763
@向前 说“就應該讓bookget發揮出更大的作用才是真正體現出bookget的技術價值”
似乎没有多少人意识到bookget这样的技术获取手段是为图源站点服务器所不容的。
走的是暗道,只宜谨小慎微,避免引起注意,怎好大模大样招摇过市?对于公开的资源,图源站点服务器预期的是Web访问,像bookget这样的工具,不属于图源站点服务器的预期访问来源。正常的Web网页浏览访问是不会形成那些用bookget死命下载那样的超长时间,大流量的持续连接的。如此 弓虽 暴 式 下载,引起对方网站管理员抵制并升级网站限制措施或是迟早的事。
xiaopengyou游客所以就該只 LZ進步,伸手的照樣伸手就是了!
世真游客对,断更,不让下载,让这些死书商一本卖上几千块,这样对白莲花好!
- 作者帖子