冲动消费了。
昨天弄abbyy,试了11、15两个版本总是不成功,正好看到软购上极度扫描 OCR 在促销,入正吧,买了38元终身版(实际软件上显示为永久订阅会员)。
1.昨天先试着导入一个PDF,修剪过(去掉附属页,并且限制在一定页码之内,当时是按doc2x的要求),结果怎么都不能直接完全识别。
2.后来点开离线识别,可以直接识别整个PDF了。但问题是原书每次换行在生成的文档中都换行,而不是恢复原有自然段,没有奢望一比一对照还原,但连开源的umi-ocr,早期的天若都能调整排版问题。
3.识别出的效果来看,还是有错的。不知道是不是离线的原因,或者说在线的识别信度更高。
4.已经申请加入极度的QQ群,希望有反馈,有调整。

人生看得几清明