Office组件把PDF文件转成Word文档(Office图片识别技术)
- 2021-09-18
- 来源/作者: 菜鸟图库/ 菜鸟图库
- 401 次浏览
如果你需要编辑PDF文件,手边又没有相关的编辑软件,也不必烦恼,只要你的电脑中安装了Office 的组件Microsoft Office Document Imaging,那么你完全可以使用它来进行PDF文件的编辑和修改,以实现PDF转WORD文档。具体步骤如下:
第一步:先安装Office 2003中的有关组件。具体方法是:使用Office 2003安装光盘中的“添加或删除功能,更改已安装的功能或删除指定的功能”更新安装该组件(如图1)。
图1
勾选 “选择应用程序的高级自定义”(如图2)。
图2
打开Office工具→Microsoft Office Document Imaging,按提示选择安装“扫描、OCR和索引服务筛选器”和“Microsoft Office Document Image Writer”(如图3)。
图3
接着重新启动计算机使修改生效(如图4)。
图4
在安装Microsoft Office Document Imaging组件后,Windows XP系统会自动安装一个名为“Microsoft Office Document Imaging Writer”的打印机。Imaging组件可以通过这个虚拟打印机,将PDF文件所保存的信息识别,从而达到将它直接转换输出到Word等文字编辑工具中的目的。第二步:用Adobe Reader 打开想转换的PDF文件,接下来 选择 “文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为 “Microsoft Office Document Image Writer”(如图5)。
图5
确认后将该PDF文件输出为 MDI格式的虚拟打印文件(如图6)。
图6
然后,运行 “Microsoft Office Document Imaging”,并利用它来 打开 刚才保存的MDI文件,选择“工具→ 将文本发送到Word ”菜单(如图7)。
图7
在弹出的“将文本发送到Word”窗口中选中“所有页面”和“ 在输出时保持图片版式不变 ”(如图8)。
图8
确认后系统会提示“必须在您执行此操作前识别该文档中的文本(OCR)。这可能需要一些时间”,不管它,点击确定即可(如图9)
图9
识别完成后,系统会自动调出Word,这时你就可以看到,刚才还不能编辑的文字,乖乖的出现在Word编辑窗口中(如图10)。
图10
需要说明的是,利用Office 2003实现PDF文件转的Word文档不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对。
以上仅在 Word2003 中可用,其他版本没有Microsoft Office Document Image Writer
标签(TAG) office组件 Office图片识别技术