威连通科技股份有限公司(QNAP Systems, Inc.) - 网络存储装置(NAS) - 首页

Language

Support

如何使用 OCR Converter 识别和提取图像中的文本?

关于 OCR Converter

OCR Converter 可以使用 OCR(光学字符识别)技术识别图像中的文本并将其转换为可编辑的文档。您可以指定源图像中的文本文件格式和文本语言。您还可以创建计划,在指定时间执行转换任务,提高转换效率。

系统要求和兼容性

要使用 OCR Converter,NAS 必须运行 QTS 4.3.4(或更高版本),并配有至少 2 GB 的内存。OCR Converter 支持 x86 和 ARM 机型,但 TAS 系列除外。运行 OCR Converter 需要 Text Editor。

OCR Converter 目前支持识别以英语、繁体中文、简体中文和德语书写的文本。未来的版本中,我们将增加对更多语言的支持。

安装

要安装和启用 OCR Converter,请登录 QTS,然后转到 App Center。请注意,QTS 在安装 OCR Converter 时会自动下载并安装 Text Editor。

创建 OCR 任务

要创建 OCR 任务,单击右上角的“Create OCR Task”(创建 OCR 任务),然后选择一种任务类型。

单次任务

您可以创建只执行一次的 OCR 任务。

  1. 选择“One-time”(单次)。
  2. 指定任务名称。
  3. 单击树结构中的文件夹,查看文件夹并选择文件。您可以双击文件夹来查看其子文件夹。
  4. 配置转换设置。
    您可以手动配置设置,或单击“Apply default settings”(应用默认设置),对转换列表中的所有文件应用默认设置。
    1. OCR 语言:选择源图像中的语言(至多三种),并按各语言在图像中的比例进行排序。
      注意:此排序会影响转换结果。您可以拖动语言来调整顺序。
    2. 输出格式:您可以选择 TXT 或 PDF 作为输出格式。使用“Text Editor”可以对转换后的文本文件进行进一步的编辑。
    3. 文本方向:指定源图像中文本的方向,以提升文本识别效率。
    4. 下载文件夹:转换后的文件将与源文件保存在同一路径中。这样有助于避免重复转换相同的图像。
  5. 验证任务设置并单击“Apply”(应用)。
    您可以在主页查看任务的状态。

计划任务

您可以使用相同的设置(例如语言和文本方向)在指定的时间转换图像文件。建议您将相同语言的图像放在相同的文件夹中。

  1. 选择“Schedule”(计划)。
  2. 指定计划的详细信息。
  3. 指定源文件夹的路径。
    注意:转换后的文件将与源文件保存在同一路径中。
  4. 选择文本语言。
  5. 选择输出格式和文本方向。
  6. 验证设置并单击“Apply”(应用)。

系统将在指定的时间自动创建 OCR 任务。

其他设置和操作

OCR Converter 还允许配置其他设置和执行各种操作:

  • 您可以选择多个文件、下载文件以及从主页移除文件。您还可以按任务的创建时间、结束时间、名称或状态对任务进行排序。
  • 您可以选择只下载转换后的文件或者下载源文件和转换后的文件。
  • 您可以从主页移除已经完成的任务。移除已完成的任务不会删除实际文件。任务结束后,您仍可以在 File Station 中查看和访问文件。
  • 要管理计划任务,单击右上角的 ,然后选择“Schedule”(计划)。
  • 要查看转换任务中的文件,请单击任务标题。
  • 您可以查看 OCR 任务的状态。单击某个文件还可以预览其源文件和转换后的文件。
  • 您可以预览转换后的文档,并将其与源图像相对比。要编辑文本文件,单击“Open with Text Editor”(使用 Text Editor 打开)。

改进转换结果

OCR Converter 基于开源引擎 Tesseract 开发而成。识别程度因图像质量和转换设置而异。建议您选择至少 300 dpi、背景清晰的图像。源图像应不含或只有数个手写文字。为有效转换图像,确保您选择了源图像中的所有语言,并按各语言的比例对其进行排序。

发布日期: 2017-10-26
您觉得这篇文章对您有帮助吗?
谢谢您,我们已经收到您的意见。
谢谢您,我们已经收到您的意见。若有任何问题,欢迎来信 support@qnap.com 。
100% 的人认为有帮助。