OCR PDF — Tekst extraheren
Extraheer tekst uit gescande PDF's met OCR. Gratis, geen upload — alle verwerking in uw browser.
Your files never leave your device. All processing happens in your browser. We don't upload, store, or access your files.
Your PDF stays on your device. A language model (~15 MB) is downloaded once to enable text recognition — no file data is sent.
Drop your scanned PDF here or click to browse
PDF files — works best with scanned documents
Hoe te gebruiken
- 1Selecteer de OCR-taal die overeenkomt met uw document
- 2Sleep uw gescande PDF naar het uploadgebied of klik om te bladeren
- 3Wacht terwijl elke pagina wordt verwerkt — OCR draait volledig in uw browser
- 4Kopieer de geextraheerde tekst naar het klembord of download als .txt-bestand
Over deze tool
Extraheer tekst uit gescande of op afbeeldingen gebaseerde PDF's met de Tesseract.js OCR-engine, volledig in uw browser. Kies uit 9 talen waaronder Nederlands, Engels, Spaans, Frans, Duits, Portugees, Italiaans, Japans en Koreaans. Het taalmodel (~15 MB) wordt eenmalig gedownload en gecacht door uw browser — uw PDF-bestand wordt nooit ergens naartoe verzonden. Resultaten kunnen naar het klembord worden gekopieerd of als .txt-bestand worden gedownload.
Veelgestelde vragen
Welke kwaliteit kan ik verwachten van OCR-tekstextractie?
De OCR-nauwkeurigheid hangt af van de kwaliteit van het gescande document. Schone, hoge-resolutie scans met standaardlettertypen behalen doorgaans een nauwkeurigheid van 90-99%. Wazige scans, handschrift of ongebruikelijke lettertypen leveren een lagere nauwkeurigheid op.
Welke talen worden ondersteund?
We ondersteunen 9 talen: Nederlands, Engels, Spaans, Portugees, Frans, Duits, Italiaans, Japans en Koreaans. Selecteer de juiste taal voor verwerking om de herkenningsnauwkeurigheid aanzienlijk te verbeteren.
Wat is het verschil tussen gescande PDF's en tekst-PDF's?
Een tekst-PDF bevat echte teksttekens die direct geselecteerd en gekopieerd kunnen worden. Een gescande PDF bevat afbeeldingen van pagina's zonder selecteerbare tekst. OCR is nodig voor gescande PDF's om de tekst uit de paginaafbeeldingen te extraheren.
Wordt mijn PDF naar een server gestuurd voor OCR-verwerking?
Nee. Uw PDF blijft op uw apparaat. De Tesseract.js OCR-engine en het taalmodel (~15 MB) worden eenmalig naar uw browser gedownload en gecacht. Alle tekstherkenning vindt lokaal plaats in uw browser.