正在查看 5 个帖子:1-5 (共 5 个帖子)
  • 作者
    帖子
  • @192200 回复 ⚑举报 

    崇鹂
    游客

    我平时如果是快速图片,就是用网页工具,如果是PDF文件,会用ABBYY。

    网页工具诸如识典、古籍酷等,识别手写体、古籍文字、繁异文字,非常强大,能碾压一般工具。但是在线工具对于批量处理图片PDF文字,大量长时间处理都有所限制了。

    ABBYY似乎是目前专业图文识别软件里正确率比较高的了,但这个软件常年不去优化其识别模型。识别现代印刷体正确率比较高,识别简体比繁体正确率更高,勉强能用,但很不适应复杂多变的古籍样本。同时本质是个PDF编辑阅览器工具,比较累赘。

    Paddle OCR 是开源工具,免费无限,理论上不断的训练是可以达到很高的识别率的,但部署有关环境比较麻烦。

    所以想问一下有没有都用过的朋友,Paddle OCR能不能胜过ABBYY,胜过网页工具?

    @192202 回复 ⚑举报 

    书格AI
    参与者

    对于您的具体需求,ABBYY 和 Paddle OCR 在文字识别方面各有侧重:

    ABBYY:
    * 现代印刷体识别:ABBYY 在现代印刷体识别方面表现出色,通常具有很高的准确率。
    * 简体中文识别优于繁体:如您所说,ABBYY 识别简体中文的准确率通常高于繁体中文。
    * 手写体识别能力有限:ABBYY FineReader PDF 15 不支持手写文本识别(ICR),对于手写体识别表现不佳。如果您需要识别手写体,ABBYY 推荐使用其 Vantage 产品。
    * 古籍文字识别:ABBYY 在处理历史文献时,对于地图和表格的识别效果不佳,可能会遗漏或误识文本。它也难以处理单一语言设置下的多语言文本(例如识别英文时会忽略法文重音符号)。有研究表明,对于印刷时代的历史文档,ABBYY FineReader 系统的错误率可能超过50%。

    Paddle OCR:
    * 开源和可定制:Paddle OCR 是一个免费开源工具包,允许用户进行自定义训练,理论上可以达到很高的识别率,特别是针对特定场景进行优化后。
    * 多语言支持:Paddle OCR 支持超过80种语言,包括简体中文、繁体中文、英文、日文等,并且其PP-OCRv5模型在识别多种文字类型和复杂手写体方面有13%的准确率提升。
    * 手写体识别:Paddle OCR 的PP-OCRv3识别模型针对手写文字识别场景进行了优化,但默认模型在手写文本上的准确率仍可能不足,需要进一步的微调或训练。例如,在PP-OCRv3上进行手写文字识别的评估结果显示准确率为54.3%。用户可以通过训练或微调预训练模型来增强手写体识别的准确率。
    * 古籍文字识别:Paddle OCR 有针对古籍数字化的定制化OCR解决方案,通过改进检测网络结构、引入竖排旋转预处理、扩展字符集、优化后处理流程等策略,可以显著提升古籍识别精度。最新版PaddleOCR 3.0中的PP-OCRv5模型也支持复杂手写体识别,以满足大模型应用对复杂文档高精度解析的需求。

    网页工具 (如识典、古籍酷):
    * 如您所说,这些在线工具在识别手写体、古籍文字、繁异文字方面表现强大,能碾压一般工具,但在批量处理和长时间处理方面可能有限制。

    总结:
    * 对于**现代印刷体(特别是简体中文)**,ABBYY 和 Paddle OCR 都能提供较高的准确率,ABBYY在专业软件中被认为准确率较高。
    * 对于**手写体和古籍文字**,Paddle OCR 通过自定义训练和其专门优化过的模型,在理论上和实际应用中更有潜力达到更高的准确率,尤其是当您能投入时间进行模型训练和调优时。ABBYY FineReader在手写体识别方面表现不佳,对于古籍文字的处理也存在挑战。
    * 网页工具在特定类型的复杂文字识别上表现出色,但受限于批量处理。

    因此,如果您的主要需求是**批量处理古籍文字和复杂手写体,并且愿意投入精力部署和训练模型**,那么 Paddle OCR 确实有可能超越 ABBYY 和您提到的网页工具,提供更精确的识别效果。Paddle OCR的PP-OCRv5模型特别指出其单模型支持五种文字类型和复杂手写体识别,并且整体识别精度相比上一代提升13个百分点。不过,部署和环境配置确实是使用Paddle OCR的挑战之一。

    (以上内容由Gemini AI自动答复,仅供参考!)

    @192205 回复 ⚑举报 

    崇鹂
    游客

    @书格AI #192202

    别闹,就把我的话重讲一遍

    @192217 回复 ⚑举报 

    崇鹂
    游客

    刚在官网的在线测试里,用张图试了一下。应该是比ABBYY好一点,但是随便扫一眼就看到错误,还比不上那些在线网站的

    @192225 回复 ⚑举报 

    zyz
    游客

    只用过ABBYY,感觉它对现代印刷品识别好一些,可以整本书快速识别。古籍就算了,准确率太低。

正在查看 5 个帖子:1-5 (共 5 个帖子)
正在查看 5 个帖子:1-5 (共 5 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:请问ABBYY和Paddle OCR比较,哪个文字识别工具更精确?
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1975年以后的资源需求或分享将会被清理删除。