Como extraer con tesseract el texto de un PDF escaneado

Hay una herramienta OCR muy potente disponible para GNU/Linux que se llama tesseract. Permite extraer textos a partir de imágenes escaneadas y funciona francamente bien. Para instalar en Debian los paquetes necesarios, basta con ejecutar con privilegios de administrador aptitude install tesseract-ocr tesseract-ocr-spa (este último paquete, por si queremos escanear textos en español). Generalmente, lo que … Leer más…

Problemas con la carga de vboxdrv y el arranque en Debian

Pongo aquí la solución al problema que arrastraba hasta ahora con mi servidor Debian, en el que no sólo no conseguía que se iniciase al arrancar el módulo vboxdrv, necesario para virtualbox, sino que todos los demás servicios que instalaba (samba, por ejemplo), tampoco conseguía que arrancasen al inicio. El problema lo detecté al intentar … Leer más…

Buscar recursivamente cadenas de texto en ficheros (GNU/Linux)

Con este comando podemos buscar texto en ficheros recursivamente a partir de una carpeta: find ruta -type f | xargs grep cadena_que_buscamos Ejemplo practico: buscar en el directorio actual y los que haya por debajo, ficheros que contengas la palabra prueba: find . -type f |xargs grep prueba P.D. Anotación tipo chuleta que me hago … Leer más…

Cómo enviar ficheros desde tu móvil por Bluetooth a un PC con Kubuntu (Karmic Koala)

Bien es sabido que para configurar la pila bluetooth en Kubuntu (al menos en su versión Karmic Koala, es decir, la 9.10) basta con tener instalado el paquete kdebluetooth, que ya debería incluir todas las dependencias necesarias. Si no lo tienes instalado, tan sólo tienes que teclear en la consola sudo aptitude install kdebluetooth. Sin … Leer más…

Herramienta GNU/Linux para renombrar ficheros JPEG según los datos EXIF que contienen

Todas las cámaras digitales del mundo generan ficheros con nombres tan poco atractivos como CIMGXXXX.JPG o PXXXXXXX.JPG, por poner dos ejemplos propios. Con jhead, disponible en tus repositorios habituales con ese nombre, permite, entre otras muchas cosas, cambiar el nombre o la fecha de los ficheros en función de los datos guardados en las tablas … Leer más…