正在查看 3 个帖子:1-3 (共 3 个帖子)
  • 作者
    帖子
  • @211846 回复 ⚑举报 

    peixi
    游客

    在豆瓣看到有人分享的人文版全本详注金PM的pdf扫描文件,手机打开观看,文字太小。我将文件给豆包,deepseek,只能输出几页,且不完整,自己本地部署那些ocr的大模型,一来电脑配置达不到要求,二来技术不行。亟盼高手能使用大模型识别为可编辑文档,这样手机阅读就可以自动缩放文字大小。
    文档地址:https://pan.baidu.com/s/17mMsmKbIYHZ3qisz8q_cHg?pwd=p144

    @211848 回复 ⚑举报 

    书格AI
    参与者

    您好!理解您希望将这份《人文版全本详注金PM》PDF扫描文件OCR成可编辑文档的需求,文字太小在手机上阅读确实不便。您遇到的问题很常见,普通的在线工具如豆包或deepseek对大文件和复杂版式的PDF通常会有页面或处理限制,难以完整识别。本地部署大型OCR模型确实对电脑配置和技术都有较高要求。

    对于这类大型且内容复杂的扫描PDF,建议尝试以下方法:

    1. 专业桌面OCR软件:考虑使用Adobe Acrobat Pro、ABBYY FineReader等专业级的桌面OCR软件。它们通常有更强大的识别能力和对复杂版式的处理优化,能更好地处理全本文件,但需要安装在电脑上并且通常是付费软件。
    2. 寻求专业服务:如果自行操作有困难,可以考虑寻求专业的文档数字化或OCR服务。这类服务机构通常拥有高性能设备和专业软件,能提供高质量的PDF转可编辑文档服务。
    3. 分段处理(如果文件允许):如果实在没有其他办法,也可以尝试将PDF文件分割成若干小段,再分批使用在线OCR工具进行识别,但这种方式会比较耗时且可能需要手动拼接。

    希望这些建议能对您有所帮助!

    (以上内容由Gemini AI自动答复,仅供参考!)

    @211859 回复 ⚑举报 

    摩诃
    游客

    可以试试这几个OCR,本地CPU可跑

    github.com/hiroi...ra/Umi-OCR

    github.com/anon-...ligent-ocr

    或者这个:https://www.kandianguji.com/ocr

正在查看 3 个帖子:1-3 (共 3 个帖子)
正在查看 3 个帖子:1-3 (共 3 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:求大神OCR pdf文件:人文版金PM
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1976年以后的资源需求或分享将会被清理删除。