#每日一书#

9.27 深度实践OCR

深度实践OCR-基于深度学习的文字识别

这本书2020年入手,当时应该是想把这本书当工具书来读。但是,这本书就是太简单了,偏完全入门级别。

我在读这本书之前,已经对OCR有一些了解,也跑过一些模型,最后还是选择了国内的一个厂商,不打算自己来做了。而这本书讲的东西,可能读几篇论文就能得到。主要还是如果有实战案例,一步一步来,这才是可以学到东西的。

这本书介绍了一些OCR的一些传统方法和深度学习的方法,后面几章就是介绍文字检测,文字识别和版面分析等方法,也算是有一个脉络。

但是呢,这本书就是简单过头了。你现在要用OCR来识别一些简单的文字场景,很多时候你都不需要做任何的训练,直接pull一个镜像,直接跑接口都给你写好了,这种就是最常见的需求。

如果你需要去优化效果,针对性的训练,来做其他的任务,包括一些图文,特定的文档等,像合同,发票,简历,证件,这种常见的特定任务,你就需要做很多的事情,而这本书就不能提供经验。

不管怎么说,这也是国内第一本介绍OCR的书,能够让一些人入门也是挺不错的。这书名,深度实践,取得不好,哈哈。
评论加载中...