正在查看 36 个帖子:51-86 (共 86 个帖子)
  • 作者
    帖子
  • @136750 回复 ⚑举报 

    未曾
    管理员

    @Ru_Evan #136749

    能力有限,因为涉及一对多的情况,需要循环套循环,我没写出来好的bat脚本。

    @136786 回复 ⚑举报 

    河北 无用+
    游客

    这个600万的重复素材不知咋搞的,毛诗品物图考7卷,每卷20-60个图,共2G。重复上千次不止,以为有数万品种。花了一个下午大致把7卷的200-300个图单列出来,删除数百G重复循环的图片。另一个1000里还是这些再重复,也有数百G。估计碑帖、图册重复率也低不了。这些图很难批量挑选。

    @136810 回复 ⚑举报 

    未曾
    管理员

    @河北 无用+ #136786

    这里的已去重
    www.shuge.org/meet/...ost-136682

     

    @136811 回复 ⚑举报 

    河北 无用+
    游客

    一直瞎忙,看帖子也没细看,原来未曾老师已经去重,我还是手工去重。整理到19000了。以后的全部删除,下载未曾老师整理好的,省太多事了。感谢未曾老师!

    @136836 回复 ⚑举报 

    考拉
    游客

    @未曾 #136810

    没少下功夫,感谢站长整理分享。

    @136877 回复 ⚑举报 

    Ru_Evan
    游客

    @未曾 #136750

    加我微信吧,我空闲时给你写一个。

    @136888 回复 ⚑举报 

    未曾
    管理员

    @Ru_Evan #136877

    哈哈,感谢先生~我换成bash脚本处理,对我来说还是bash容易些了

    @136912 回复 ⚑举报 

    曉螃蟹
    游客

    今晚我用这个方式试试,看看能不能把文件编号和对应的书画名称对应起来:

    1.通过工具导出百度网盘对应的文件名称,处理去重后只剩14894个(暂时未能验证导出的文件名称是否有遗漏)。

    2.通过脚本用编号在网站查询,提取对应的名称,再写入表格对应位置。

    3d1ba712f455e0015ba8f1f86b422a3

    6e242bd7abf1da40f1b2b4ec6de7524

    这样提取到的作品名称重复的字段会比较多啊,因为网站上就是这样标注的,不知道还有没有更好的方法(空白的可能是网站卡了没取信息)

    @136913 回复 ⚑举报 

    未曾
    管理员

    @曉螃蟹 #136912

    我已基本重命名完毕了,正在重新上传一份到百度网盘,上传完毕后会分享

    @136967 回复 ⚑举报 

    fwsh
    游客

    请问更新了吗?

    @136968 回复 ⚑举报 

    未曾
    管理员

    @fwsh #136967

    还没传完,估计今晚传完

    @136972 回复 ⚑举报 

    新手
    游客

    未先生功德无量!!!

    @136978 回复 ⚑举报 

    达芬奇的画
    游客

    微信图片_20240504150031左下角的画,有知道是哪位大家的画作吗?

    @136980 回复 ⚑举报 

    未曾
    管理员
    @137008 回复 ⚑举报 

    山远天高
    游客

    @达芬奇的画 #136978

    十二月月令图轴.八月

    111

    @137015 回复 ⚑举报 

    fwsh
    游客

    @未曾 #136968

    先谢未老

    @137047 回复 ⚑举报 

    xuanyinyaran
    游客

    感谢各位辛勤付出的朋友~~向未曾先生精益求精的精神学习!

    @137049 回复 ⚑举报 

    未曾
    管理员

    @fwsh #136967

    台北故宫书画600万像素(已去重和重命名),去重后大概大小1.15T
    pan.baidu.com/s/1TN...Q?pwd=6666

    说明一下下载的图片文件名对应意义,依次文件名为例
    例如:16__唐李昭道湖亭遊騎.軸故畫00000400000__K2A000004N000000000PAA

    其中16代表下载自网页

    https://digitalarchive.npm.gov.tw/Painting/Content?pid=16&Dept=P

    故畫000004代表台北故宫博物院藏品编号

    K2A000004N000000000PAA代表台北故宫博物院数字图片编号(单个藏品可能包含多张数字图片)

    其中包含:文件目录.txt
    另外修订了一些原先下载的残损无效文件
    更新于2024年5月5日
    @137050 回复 ⚑举报 

    njzj99
    游客

    已转存,未曾先生辛苦了,衷心感谢!

    @137053 回复 ⚑举报 

    寒梦
    游客

    謝謝未曾先生,您辛苦了!

    @137055 回复 ⚑举报 

    lee
    游客

    功德无量

    @137056 回复 ⚑举报 

    lee
    游客

    这次不需要也要买个百度会员了。

    @137058 回复 ⚑举报 

    河北 无用+
    游客

    未曾老师辛苦了,多谢!

    @137059 回复 ⚑举报 

    fwsh
    游客

    @未曾 #137049

    太感谢了

    @137060 回复 ⚑举报 

    河北 无用+
    游客

    这大概未曾老师要用编程软件做个模块出来,制定好批量重命名规则,自动搜检做到的吧,要是手工可一时难以做到

    @137066 回复 ⚑举报 

    小kleiber
    游客

    @未曾 #137049

    链接失效了已经..

    十分感谢!

    @137069 回复 ⚑举报 

    未曾
    管理员

    @小kleiber #137066

    测试正常

    @137072 回复 ⚑举报 

    lee
    游客

     

    确实失效了。是不是被和谐了。能不能加密压缩后上传,防止和谐减少文件数量。微信截图_20240505135654

    @137074 回复 ⚑举报 

    未曾
    管理员

    @lee #137072

    我再次测试正常,你换个浏览器试试

    @137075 回复 ⚑举报 

    lee
    游客

    又可以了

    @137077 回复 ⚑举报 

    dxx
    游客

    台北故宫书画,目前淘宝还没有发现打包出售,何时整体出售或分开零售,拭目以待

    Snipaste_2024-05-05_14-26-56

    @137107 回复 ⚑举报 

    考拉
    游客

    14908__唐人書佛說廣博嚴淨不退轉輪經.卷故書00006400000__K2B000064N000000000PAP 网盘内 此幅有问题,不知道是不是原文件的错误。

    @137115 回复 ⚑举报 

    未曾
    管理员

    @考拉 #137107

    感谢反馈,已修正此图到原链接。另:或可单独下载此图

    @137232 回复 ⚑举报 

    hegem
    游客

    能否分享元数据和文件名、官网链接对应的表格?谢谢。

    @137534 回复 ⚑举报 

    爱好者
    游客

    为什么转存到网盘后,里面图片不全?但显示转存成功

    @137615 回复 ⚑举报 

    xiaopengyou
    游客

    最新媒體報導台北故宮的烏龍笑話,導致無法下載高清,就放在這吧

    IMG_4137IMG_4138

正在查看 36 个帖子:51-86 (共 86 个帖子)
正在查看 36 个帖子:51-86 (共 86 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:台北故宫600万像素书画图像
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1973年以后的资源需求或分享将会被清理删除。