威聯通科技股份有限公司(QNAP Systems, Inc.) - 網路儲存設備(NAS)

Language

Support

如何使用 OCR Converter 辨識與擷取影像中的文字?

關於 OCR Converter

OCR Converter 使用 OCR(光學字元識別)技術辨識影像中的文字,並轉換成可編輯的文件。 您可以指定文字的檔案格式以及來源影像中的文字語言。 您也可以建立排程時間,在指定的時間執行轉換任務以提高轉換效率。

系統需求與相容性

NAS 必須執行 QTS 4.3.4(或之後的版本),並且至少有 2GB 的記憶體,才可使用 OCR Converter。 OCR Converter 支援 x86 與 ARM 機型,但 TAS 系列除外。 Text Editor 則是執行 OCR Converter 的必備工具。

OCR Converter 目前支援的語言有英文、繁體中文、簡體中文以及德文。 未來的版本將支援更多語言。

安裝

若要安裝與啟用 OCR Converter,請登入 QTS,然後前往 App Center。 請注意,安裝 OCR Converter 時,QTS 會自動下載與安裝 Text Editor。

建立 OCR 任務

若要建立 OCR 任務,請點擊右上角的〔Create OCR Task〕(建立 OCR 任務),然後選擇任務類型。

一次性任務

您可以建立僅執行一次的 OCR 任務。

  1. 選擇〔One-time〕(一次性)。
  2. 指定任務名稱。
  3. 點擊樹狀結構中的資料夾,查看資料夾並選擇檔案。 您可以按兩下資料夾,進一步查看子資料夾。
  4. 轉換設定。
    您可以手動設定,也可點擊〔Apply default settings〕(套用預設設定),將預設設定套用至轉換清單中的所有檔案
    1. OCR 語言: 選擇最多三種來源影像的語言,並依據語言在影像中的比例加以排序。
      備註: 此順序將影響轉換結果。 拖曳語言即可調整順序。
    2. 輸出格式: 輸出格式的選項有 TXT 和 PDF。 您可以使用「Text Editor」進一步編輯轉換後的文字。
    3. 文字方向: 指定來源影像中的文字方向,提高辨識文字的效率。
    4. 下載資料夾: 轉換後的檔案會儲存在來源檔案的路徑位置。 如此可避免重複轉換相同的影像。
  5. 確認任務設定,然後點擊〔Apply〕(套用)。
    您可以在首頁查看任務的狀態。

排程任務

您可以使用相同的設定(例如語言和文字方向),指定轉換影像檔案的排程時間。 建議您將語言相同的影像放置在同一個資料夾中。

  1. 選擇〔Schedule〕(排程)。
  2. 指定排程的詳細資料。
  3. 指定來源資料夾的路徑。
    備註: 轉換後的檔案會儲存在來源檔案的路徑位置。
  4. 選擇文字的語言。
  5. 選擇輸出格式與文字方向。
  6. 確認設定,然後點擊〔Apply〕(套用)。

系統將自動於指定時間建立 OCR 任務。

其他設定與操作

OCR Converter 也能讓您配置其他設定與執行各種操作:

  • 您可以在首頁選擇多個檔案、下載檔案以及移除檔案。 您也可以依據任務的建立時間、結束時間、名稱或狀態加以排序。
  • 您可以只下載轉換後的檔案,也可以下載來源檔案與轉換後的檔案。
  • 可從首頁移除完成的任務。 移除完成的任務並不會刪除實際檔案。 任務完成後,您仍可在 File Station 查看與存取檔案。
  • 若要管理排程的任務,請點擊右上角的 ,然後選擇〔Schedule〕(排程)。
  • 若要查看轉換任務中的檔案,請點擊任務名稱。
  • 您可以查看 OCR 任務的狀態。 您也可以點擊檔案,預覽其來源檔案和轉換後的檔案。
  • 您可以預覽轉換後的文件,並與來源影像比較。 若要編輯文字檔案,請點擊〔Open with Text Editor〕(以 Text Editor 開啟)。

改善轉換結果

OCR Converter 的建構基礎是開放原始碼引擎 Tesseract。 辨識程度會隨影像品質與轉換設定而改變。 建議選擇至少有 300 dpi 且背景乾淨的影像。 此外,來源影像不宜含有過多手寫文字。 為確保有效率地轉換影像,請選擇來源影像中出現的所有語言,並依據各語言所佔的比例來排序。

發佈日期: 2017-10-26
覺得這篇文章對您有幫助?
謝謝您,我們已經收到您的意見。
謝謝您,我們已經收到您的意見。若有任何問題,歡迎來信 support@qnap.com
100% 的人認為有幫助。