OCR PDF — 텍스트 추출

OCR을 사용하여 스캔된 PDF에서 텍스트를 추출하세요. 무료, 업로드 없음 — 모든 처리는 브라우저에서 실행됩니다.

파일은 사용자의 기기에 보관됩니다서버 업로드 없음100% 무료보안에 대해 자세히 알아보기

Your files never leave your device. All processing happens in your browser. We don't upload, store, or access your files.

Your PDF stays on your device. A language model (~15 MB) is downloaded once to enable text recognition — no file data is sent.

Drop your scanned PDF here or click to browse

PDF files — works best with scanned documents

사용 방법

  1. 1문서에 맞는 OCR 언어를 선택하세요
  2. 2스캔한 PDF를 업로드 영역에 드롭하거나 클릭하여 찾아보기
  3. 3각 페이지가 처리되는 동안 기다리세요 — OCR은 브라우저에서 완전히 실행됩니다
  4. 4추출된 텍스트를 클립보드에 복사하거나 .txt 파일로 다운로드

이 도구에 대하여

Tesseract.js OCR 엔진을 사용하여 스캔된 PDF 또는 이미지 기반 PDF에서 텍스트를 추출합니다. 모든 처리는 브라우저에서 완전히 수행됩니다. 영어, 스페인어, 프랑스어, 독일어, 포르투갈어, 이탈리아어, 네덜란드어, 일본어, 한국어 등 9개 언어에서 선택할 수 있습니다. 언어 모델(~15 MB)은 한 번만 다운로드되어 브라우저에 캐시됩니다. PDF 파일은 절대 전송되지 않습니다. 결과는 클립보드에 복사하거나 .txt 파일로 다운로드할 수 있습니다.

자주 묻는 질문

OCR 텍스트 추출의 품질은 어떻습니까?

OCR 정확도는 스캔된 문서의 품질에 따라 달라집니다. 표준 글꼴을 사용한 깨끗한 고해상도 스캔은 일반적으로 90-99%의 정확도를 달성합니다. 흐릿한 스캔, 손글씨 또는 특이한 글꼴은 정확도가 낮아집니다.

어떤 언어가 지원됩니까?

9개 언어를 지원합니다: 한국어, 영어, 스페인어, 포르투갈어, 프랑스어, 독일어, 이탈리아어, 네덜란드어, 일본어. 처리 전에 올바른 언어를 선택하면 인식 정확도가 크게 향상됩니다.

스캔 PDF와 텍스트 PDF의 차이점은 무엇입니까?

텍스트 PDF는 직접 선택하고 복사할 수 있는 실제 텍스트 문자를 포함합니다. 스캔 PDF는 선택 가능한 텍스트가 없는 페이지 이미지를 포함합니다. 스캔 PDF에서 텍스트를 추출하려면 OCR이 필요합니다.

OCR 처리를 위해 PDF가 서버로 전송됩니까?

아니요. PDF는 사용자의 장치에 남아 있습니다. Tesseract.js OCR 엔진과 언어 모델(~15 MB)은 브라우저에 한 번만 다운로드되어 캐시됩니다. 모든 텍스트 인식은 브라우저에서 로컬로 수행됩니다.

ShareTwitterRedditLinkedIn