- 作者帖子
会飞的鱼游客
会飞的鱼游客未曾老师,早上好
未曾管理员你新提这两种都是 Flash 模式的(国图较老的数据形式),麻烦些
会飞的鱼游客谢谢未曾老师,只要未曾老师有办法就行,时间不是问题,等您的好消息
未曾管理员嗯,好吧
那说好啊,Flash格式就这一本啊~我描述一下这个过程啊
首先要通过浏览器抓取到第一页的Flash页面地址
例如此本
http://mylib.nlc.cn/system/doc/books/你的用户ID/20140923_01/1987371/1
获取页面总数:47页
自增长(可用excel生成)生成为http://mylib.nlc.cn/system/doc/books/你的用户ID/20140923_01/1987371/1
至http://mylib.nlc.cn/system/doc/books/你的用户ID/20140923_01/1987371/47
然后批量下载这些页面(可以用idm)
然后是提取这些 swf文件的jpg图片
最后将批量导出的jpg文件打包为pdf
天启二年壬戌科进士履历.一卷.明天启时期
下载: files.shuge.org/wl/?i...Q8ITT64xFL**请恕我以下言论的冒犯
不是你能等,我就是一下就能获取的啊~
我也是要耗费精力和时间啊
会飞的鱼游客谢谢未曾老师,又学到一项技能,这也不难的
燃犀小医童游客@未曾 #6004
请教老师,您在文中提到的自增长前面的“浏览器抓取到第一页的 Flash 页面地址”请问怎么做到的。。我网上查方法,在inter工具选项里查看文件,但是还是木有找到,好多记录,不确定哪个是刚才查到带SWF的...
未曾管理员@燃犀小医童 #7635
你用的什么浏览器啊,请截图你的这个界面
燃犀小医童游客搜狗浏览器
未曾管理员@燃犀小医童 #7641
你可以试试按F12看看是什么,我没用过搜狗浏览器。个人建议使用chrome
燃犀小医童游客好的老师,我回头换个浏览器。这个麻烦您看下。
未曾管理员你要点全文阅读才会加载哦 Flash 页面地址
燃犀小医童游客老师,是不是这个?
未曾管理员@燃犀小医童 #7655
不是,是一个1的url,如图
燃犀小医童游客
硖川居士游客只好再次请教,用了上述方法,好像没有找到那个1 的 url,带“1”的都是一些零碎的图片。
未曾管理员
硖川居士游客感觉有点复杂,那么请教如图的格式应该如何获取呢?
滨城小渔夫游客@未曾 #6004
未曾老师,请问我安照你提供的方法找到了国图网资源《西藏地方是中国不可分割的一部分》的URL:
mylib.nlc.cn/syste...7/559828/1
……
mylib.nlc.cn/syste...559828/610
,然后用IDM进行下载,但还是下载不了,提示错误,会不会是在IDM下载的时候需要填写我的用户名和密码?还是其他什么原因?谢谢!
滨城小渔夫游客还出现了如下提示,我电脑防火墙设置应该是没有问题,以前用idm 成功下载过。麻烦了!
未曾管理员
滨城小渔夫游客感谢未曾老师,已经按照提示修改IDM,前面的问题已经解决。但又出现了新问题!
1、只能下载前33页,且是swf格式。但第34页往后下载下来的都是提示资源不存在的提示图片。前往国图网站,提示由于版权原因,无法浏览34以后的页面。请问这样情况是不是就没招了?
2、已下载的swf,使用反编译软件“avi20106中文版”,结果大部分是切成碎片的小图,这个是哪里没整对,软件的各个功能都已尝试了,还是不行,麻烦提示一下,谢谢!
未曾管理员@滨城小渔夫 #8097
你应该是国图那边因为版权限制了
- 作者帖子
正在查看 23 个帖子:1-23 (共 23 个帖子)
正在查看 23 个帖子:1-23 (共 23 个帖子)
正在查看 23 个帖子:1-23 (共 23 个帖子)