OCR PDF / imagen

Extrae texto de PDFs escaneados, fotos y documentos. Reconocimiento en español por default, inglés opcional.

Cargando el motor de OCR en segundo plano (1.13 MB, solo la primera vez)…

Suelta tu PDF, imagen o foto aquíSoportamos JPG, PNG, HEIC, WebP y PDF.Tus archivos nunca salen de tu navegador.

Sobre esta herramienta

Te damos tres salidas: el texto reconocido editable en pantalla para que corrijas errores antes de descargar, un archivo .txt con tus correcciones, y un PDF buscable donde la imagen original se preserva visible y el texto reconocido queda como una capa invisible que puedes encontrar con Ctrl+F en cualquier visor PDF.

El motor es tesseract.js con modelo de español y opcionalmente inglés. Activa el checkbox “Mejorar escaneo” si tu documento tiene sombras, fondo coloreado o está un poco inclinado — pasa la imagen por un pipeline de binarización Otsu + denoise + corrección de inclinación (deskew) antes del OCR. El modelo y la mejora de escaneo se descargan una sola vez y quedan en caché para próximas visitas.

Todo el procesamiento ocurre en este navegador — el documento, las imágenes y el texto reconocido nunca salen de tu computadora.