扫描版的 PDF 都是图片,在里面查找内容是不可能的。所以「在扫描版 PDF 文档中查找内容」这个问题可以拆解为两部分:一是识别 PDF 中的文字,二是搜索里面的内容。

安装软件 #

开始教程之前,先安装好需要的软件:

 1
 2
 3
 4
 5
 6