QNAP Systems, Inc. - 네트워크 부착형 스토리지(NAS)

Language

Support

OCR Converter를 사용하여 이미지에서 텍스트를 인식하고 추출하는 방법은?

OCR Converter 정보

OCR Converter는 OCR(광학 문자 인식) 기술을 사용하여 이미지에 있는 텍스트를 인식하고 이를 편집 가능한 문서로 변환합니다. 소스 이미지의 텍스트 파일 형식과 텍스트의 언어를 지정할 수 있습니다. 또한 지정한 시간에 변환 작업이 수행되도록 스케줄을 만들어 변환 효율성을 높일 수 있습니다.

시스템 요구 사항 및 호환성

OCR Converter를 사용하려면, NAS가 QTS 4.3.4 이상을 실행 중이고 최소 2 GB의 메모리를 가지고 있어야 합니다. OCR Converter는 TAS 시리즈를 제외한 x86 기반 및 ARM 기반 모델을 지원합니다. OCR Converter를 실행하려면 Text Editor가 필요합니다.

OCR Converter는 현재 영어, 중국어 번체, 중국어 간체 및 독일어로 쓰여진 텍스트의 인식을 지원합니다. 향후 릴리스에서 더 많은 언어를 지원할 예정입니다.

설치

OCR Converter를 설치하고 활성화하려면, QTS에 로그인한 다음 App Center로 이동합니다. OCR Converter를 설치할 때 QTS가 자동으로 Text Editor를 다운로드하고 설치한다는 점을 참고하십시오.

OCR 작업 생성

OCR 작업을 생성하려면 오른쪽 위 구석에서 “OCR 작업 생성”을 클릭한 다음 작업 유형을 선택합니다.

일회 작업

단 한번 수행되는 OCR 작업을 생성할 수 있습니다.

  1. “일 회”를 선택합니다.
  2. 작업 이름을 지정합니다.
  3. 트리 구조에서 폴더를 클릭하여 폴더를 확인하고 파일을 선택합니다. 폴더를 두 번 클릭하여 해당 하위 폴더를 봅니다.
  4. 변환 설정을 구성합니다.
    설정을 수동으로 구성하거나 "기본 설정 적용"을 클릭하여 변환 목록에 있는 모든 파일에 기본 설정을 적용할 수 있습니다.
    1. OCR 언어: 소스 이미지에서 최대 세 개의 언어를 선택하고 이미지에서의 비율에 따라 언어에 순위를 매깁니다.
      참고: 이 순서는 변환 결과에 영향을 미칩니다. 언어를 끌어서 순서를 조정할 수 있습니다.
    2. 출력 형식: 출력 형식으로 TXT 또는 PDF를 선택할 수 있습니다. “Text Editor”를 사용하여 변환된 텍스트를 좀더 편집할 수 있습니다.
    3. 텍스트 방향: 소스 이미지에 있는 텍스트의 방향을 지정하여 텍스트 인식의 효율성을 높일 수 있습니다.
    4. 다운로드 폴더: 변환된 파일은 소스 파일과 동일한 경로에 저장됩니다. 이것은 동일한 이미지를 반복해서 변환하는 것을 방지하는 데 도움이 됩니다.
  5. 작업 설정을 확인한 다음 "적용"을 클릭합니다.
    홈페이지에서 작업의 상태를 볼 수 있습니다.

예약된 작업

동일한 설정(언어 및 텍스트 방향 등)을 사용하여 지정된 시간에 이미지 파일을 변환할 수 있습니다. 같은 언어로 된 이미지들을 같은 폴더에 넣는 것이 좋습니다.

  1. “예약”을 선택합니다.
  2. 예약에 대한 상세 정보를 지정합니다.
  3. 소스 폴더의 경로를 지정합니다.
    참고: 변환된 파일은 소스 파일과 동일한 경로에 저장됩니다.
  4. 텍스트의 언어를 선택합니다.
  5. 출력 형식과 텍스트 방향을 선택합니다.
  6. 설정을 확인한 다음 “적용”을 클릭합니다.

OCR 작업이 지정한 시간에 자동으로 생성됩니다.

기타 설정 및 작동

또한 OCR Converter에서 기타 설정을 구성하고 다양한 작업을 수행할 수 있습니다:

  • 홈페이지에서 여러 파일을 선택하고, 파일을 다운로드하거나 제거할 수 있습니다. 또한 생성 시간, 종료 시간, 이름 또는 상태를 기준으로 작업을 정렬할 수 있습니다.
  • 변환된 파일만 다운로드하거나 소스 파일과 변환된 파일을 모두 다운로드하도록 선택할 수 있습니다.
  • 홈페이지에서 완료된 작업을 제거할 수 있습니다. 완료된 작업을 제거할 때 실제 파일은 삭제되지 않습니다. 작업 후 여전히 File Station에서 파일을 보고 액세스할 수 있습니다.
  • 예약된 작업을 관리하려면 오른쪽 위 구석에 있는 을 클릭한 다음 "예약"을 선택합니다.
  • 변환 작업에 있는 파일을 보려면 작업 제목을 클릭합니다.
  • OCR 작업의 상태를 볼 수 있습니다. 또한 파일을 클릭하여 해당 소스 파일과 변환된 파일을 미리볼 수 있습니다.
  • 변환된 문서를 미리 보고 소스 이미지와 비교할 수 있습니다. 텍스트 파일을 편집하려면 "Text Editor로 열기"를 클릭합니다.

변환 결과 개선

OCR Converter는 오픈 소스 엔진 Tesseract를 기반으로 합니다. 인식 수준은 이미지 품질과 변환 설정에 따라 달라집니다. 300 dpi 이상이면서 배경이 깨끗한 이미지를 선택할 것을 권장합니다. 소스 이미지에는 손글씨로 쓴 단어가 없거나 극소수여야 합니다. 이미지를 효율적으로 변환하려면, 소스 이미지에 나타나 있는 언어를 모두 선택하고 언어를 비율에 따라 순위를 매겨야 합니다.

릴리스 날짜: 2017-10-26
도움이 되었습니까?
피드백을 주셔서 감사드립니다.
피드백을 주셔서 감사드립니다. 다른 질문 사항이 있으면 support@qnap.com으로 문의해 주시기 바랍니다.
100% 의 사용자들이 도움이 된다고 생각할 것입니다.