正在查看 10 个帖子:1-10 (共 10 个帖子)
  • 作者
    帖子
  • @127291 回复 ⚑举报 

    世真
    游客

    为了方便查看,都把下载的资料合成了PDF..慢慢的时间长了,也不知道有多少坏PDF的存在,直到现在没找到一款适合的检测处理软件,望大佬们给予帮助。

    @127295 回复 ⚑举报 

    無名
    游客
    @127383 回复 ⚑举报 

    恩县布衣
    游客

    我一直用一个最笨最简单的办法,搜索出所有PDF,然后缩略图查看,损坏文件缩略图不会显示。但是对一些特别大的正常PDF缩略图也不显示。

    @127395 回复 ⚑举报 

    shimang
    游客

    请问怎样才能显示PDF文件的缩略图?

    @127412 回复 ⚑举报 

    世真
    游客

    @恩县布衣 #127383

    当你数据量大的时候,你就很不好搞。不像我的话都是几十万个,几百万个。

    @127423 回复 ⚑举报 

    guozibaba
    游客

    @世真 #127412

    老马(uv、pdg2pic等相关软件的作者,)曾出过一个软件,pdftoy,可以去老马的官网参考:

    www.cnblogs.com/stron...72080.html

    2、批量检查PDF文件是否损坏

    这个功能大家都很需要,但能做好的软件真心不太多。PT中采用两种方法进行检查:

    只查文件结构。好处是速度比较快,坏处是只检查PDF文件结构是否完整,但忽略了PDF内部数据可能存在的问题,所以存在漏检的可能。
    采用UnicornViewer(UV)中的PDF引擎,在内存中对PDF逐页进行解码、模拟显示(术语是“渲染render”),从而能够检查PDF内部数据是否有错。换句话说,用这个功能检查不报错的,至少用UV看是不会有什么问题。

    无法直接下载到,此软不是免费的,具体如何下载,可参看网站。我也不太清楚。

     

    @127424 回复 ⚑举报 

    尘埃
    游客

    我这有个自用的办法,用的python代码

    import os
    from PyPDF2 import PdfWriter

    file_path = 'D:\\BaiduNetdiskDownload\\'

    files = os.listdir(file_path)

    for file in files:
    merger = PdfWriter()
    try:
    merger.append(file_path + file)
    except:
    print(file_path + file,"不正常!!!")
    merger.close()
    print(len(files))

    @127436 回复 ⚑举报 

    世真
    游客

    @guozibaba #127423

    国外有一个软件可以检测,但是好像删除有问题。

    @127565 回复 ⚑举报 

    世真
    游客

    关于这款软件地址是:

    versaweb.dl.sourceforge.net/proje...Finder.msi

    界面如下:

    微信图片_20240208154721

    优点,能检测,能删除确认是坏的。

    缺点:有问题的只能手工一个个删。而且移动坏的无效(不知道是不是操作问题),删除也只能删除明确是坏PDF

    @127566 回复 ⚑举报 

    世真
    游客

    微信图片_20240208154731

正在查看 10 个帖子:1-10 (共 10 个帖子)
正在查看 10 个帖子:1-10 (共 10 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:求助。各位大佬,有没有什么软件可以批量检测删除坏PDF?
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1973年以后的资源需求或分享将会被清理删除。