Indexar y buscar ficheros PDF

Bueno, PDF o de cualquier otro tipo. También en djvu, o documentos Word. Si usas tu escaner para gestión documental, sabrás apreciar esto porque tendrás un montón de PDF o DJVU en tu disco duro, y a veces querrás localizar uno de ellos según lo que contengan.

Te recomiendo Recoll, una herramienta basada en Qt, que es  bastante completita y fácil de usar. Está en los repositorios de Ubuntu, así que no deberías tener ningún problema para instalarla.

Eso si, Recoll necesita algunos programas para mejorar sus búsquedas. No son imprescidibles, pero ampliará los ficheros en los que puede buscar.

  • Haz un "apt-get install antiword" para instalar antiword.
  • Haz un "apt-get install djvulibre-bin para instalar djvutxt
  • Haz un "apt-get install aspell-es" para instalar los diccionarios castellanos de Aspell.

Vale, y además puedes editar tu "/etc/crontab" como root para añadir recollindex, una utilidad incluida en el paquete que reindexa tu disco duro. Por ejemplo, puedes añadir esto a tu "etc/crontab":


24 * * * * lacofi  recollindex

Lo que significa que cada hora, a esa hora y 24 minutos, el usuario "lacofi" reindexará de nuevo su disco duro.

Hala, que lo disfrutes.

Be Sociable, Share!

Puedes seguir cualquier respuesta a esta entrada mediante el canal RSS 2.0. Puedes dejar un comentario o enviar un trackback desde tu propio sitio.

Un comentario »

 
  • avatar avatarpedeefes dice:

    Para buscar documentos en formtao pdf disponibles en la red puedes utilizar el buscador http://www.pedeefes.com que realiza la busqueda por palabras clave en los documentos pdf indexados en su base de datos y además te presenta información sobre el documento como su tamaño, número de páginas, autor,fecha de creación, etc y una imagen de la primera página.

 

Deja un comentario

Disculpa, debes iniciar sesión para escribir un comentario.