- 作者帖子
崇鹂游客我平时如果是快速图片,就是用网页工具,如果是PDF文件,会用ABBYY。
网页工具诸如识典、古籍酷等,识别手写体、古籍文字、繁异文字,非常强大,能碾压一般工具。但是在线工具对于批量处理图片PDF文字,大量长时间处理都有所限制了。
ABBYY似乎是目前专业图文识别软件里正确率比较高的了,但这个软件常年不去优化其识别模型。识别现代印刷体正确率比较高,识别简体比繁体正确率更高,勉强能用,但很不适应复杂多变的古籍样本。同时本质是个PDF编辑阅览器工具,比较累赘。
Paddle OCR 是开源工具,免费无限,理论上不断的训练是可以达到很高的识别率的,但部署有关环境比较麻烦。
所以想问一下有没有都用过的朋友,Paddle OCR能不能胜过ABBYY,胜过网页工具?
书格AI参与者对于您的具体需求,ABBYY 和 Paddle OCR 在文字识别方面各有侧重:
ABBYY:
* 现代印刷体识别:ABBYY 在现代印刷体识别方面表现出色,通常具有很高的准确率。
* 简体中文识别优于繁体:如您所说,ABBYY 识别简体中文的准确率通常高于繁体中文。
* 手写体识别能力有限:ABBYY FineReader PDF 15 不支持手写文本识别(ICR),对于手写体识别表现不佳。如果您需要识别手写体,ABBYY 推荐使用其 Vantage 产品。
* 古籍文字识别:ABBYY 在处理历史文献时,对于地图和表格的识别效果不佳,可能会遗漏或误识文本。它也难以处理单一语言设置下的多语言文本(例如识别英文时会忽略法文重音符号)。有研究表明,对于印刷时代的历史文档,ABBYY FineReader 系统的错误率可能超过50%。Paddle OCR:
* 开源和可定制:Paddle OCR 是一个免费开源工具包,允许用户进行自定义训练,理论上可以达到很高的识别率,特别是针对特定场景进行优化后。
* 多语言支持:Paddle OCR 支持超过80种语言,包括简体中文、繁体中文、英文、日文等,并且其PP-OCRv5模型在识别多种文字类型和复杂手写体方面有13%的准确率提升。
* 手写体识别:Paddle OCR 的PP-OCRv3识别模型针对手写文字识别场景进行了优化,但默认模型在手写文本上的准确率仍可能不足,需要进一步的微调或训练。例如,在PP-OCRv3上进行手写文字识别的评估结果显示准确率为54.3%。用户可以通过训练或微调预训练模型来增强手写体识别的准确率。
* 古籍文字识别:Paddle OCR 有针对古籍数字化的定制化OCR解决方案,通过改进检测网络结构、引入竖排旋转预处理、扩展字符集、优化后处理流程等策略,可以显著提升古籍识别精度。最新版PaddleOCR 3.0中的PP-OCRv5模型也支持复杂手写体识别,以满足大模型应用对复杂文档高精度解析的需求。网页工具 (如识典、古籍酷):
* 如您所说,这些在线工具在识别手写体、古籍文字、繁异文字方面表现强大,能碾压一般工具,但在批量处理和长时间处理方面可能有限制。总结:
* 对于**现代印刷体(特别是简体中文)**,ABBYY 和 Paddle OCR 都能提供较高的准确率,ABBYY在专业软件中被认为准确率较高。
* 对于**手写体和古籍文字**,Paddle OCR 通过自定义训练和其专门优化过的模型,在理论上和实际应用中更有潜力达到更高的准确率,尤其是当您能投入时间进行模型训练和调优时。ABBYY FineReader在手写体识别方面表现不佳,对于古籍文字的处理也存在挑战。
* 网页工具在特定类型的复杂文字识别上表现出色,但受限于批量处理。因此,如果您的主要需求是**批量处理古籍文字和复杂手写体,并且愿意投入精力部署和训练模型**,那么 Paddle OCR 确实有可能超越 ABBYY 和您提到的网页工具,提供更精确的识别效果。Paddle OCR的PP-OCRv5模型特别指出其单模型支持五种文字类型和复杂手写体识别,并且整体识别精度相比上一代提升13个百分点。不过,部署和环境配置确实是使用Paddle OCR的挑战之一。
(以上内容由Gemini AI自动答复,仅供参考!)
崇鹂游客@书格AI #192202
别闹,就把我的话重讲一遍
崇鹂游客刚在官网的在线测试里,用张图试了一下。应该是比ABBYY好一点,但是随便扫一眼就看到错误,还比不上那些在线网站的
zyz游客只用过ABBYY,感觉它对现代印刷品识别好一些,可以整本书快速识别。古籍就算了,准确率太低。
- 作者帖子
正在查看 5 个帖子:1-5 (共 5 个帖子)
正在查看 5 个帖子:1-5 (共 5 个帖子)
正在查看 5 个帖子:1-5 (共 5 个帖子)