Escanear para gestión documental con DjVu

En mi trabajo se acumulan una enorme cantidad de papeles, asi que no quiero ni pensar lo que le ocurrire por ejemplo a un abogado. Pero en fin, la cuestión es que los dispositivos de almacenamiento masivo (por ejemplo, discos duros externos USB) han bajado tanto de precio que hoy en dia resulta muy factible ponerse a escanear como un loco y convertir nuestro ordenador en una máquina de microfilmado.

En realidad ésta es una vieja idea que me rondaba en la cabeza desde hace años. De hecho, en su día (cuando usaba Windows), manejaba habitualmente el Pagis Pro de Xerox, un programa que me encantaba. Pero dejé de hacerlo porque tropecé con muchas limitaciones técnicas propias del momento (discos duros pequeños, escaner lentiiiisimo a pesar de ser SCSI, etc). Hoy, ya no tengo Windows ni Pagis Pro, claro, pero el escaneo documental en forma de microfilmado o facsimil (Gestión Documental, que se llama) es ya rentable porque la tecnología ha mejorado mucho. Solo necesitamos un programa Linux que lo permita hacer de forma decente, y aunque éste es un capítulo pendiente en el mundo Linux, todavía podemos hacer cosas bastante interesantes con DjVu.

DjVu es la versión libre (aunque limitada) de un programa comercial creado por la empresa LizardTech. Lo que hace, concretamente, es tomar una imagen (PNM, por ejemplo), y comprimirla con algoritmos terriblemente eficientes. Parece una tontería, un compresor vulgar, pero os aseguro que es espectacular. Para que os hagais una idea, una imagen BW (Lineart), tomada de una página A4 a 300 dpi, pasa de 1,1 Mb (PNM) a 32 Kb (DjVu). Si, habeis oído bien: ¡¡32 Kb!!.

Djvu incluye tres compresores diferentes y unas cuantas utilidades. Los compresores son:

  1. cjb2: es el más importante y eficiente. Necesita imágenes Lineart (BW, imágenes de 1 bit), con lo que se usa para páginas de texto o con gráficos muy simples, sin gradación de grises. Parece limitado, pero en la práctica casi todas (si no todas) las páginas que vamos a escanear en Gestión Documental son precisamente de este tipo.
  2. cpaldjvu: es muy eficiente, pero solo con un tipo de imágenes de pocos colores y grandes áreas monocromáticas, por ejemplo capturas de pantalla. Es muy ineficiente con imagenes fotográficas que incluyan gradación de colores o de grises (es decir, la mayoría). En la práctica, yo no lo uso casi nunca.
  3. c44: es un compresor de imágenes fotográficas, ya sea en escala de grises o en color. Muy eficiente, con una compresión superior a la de otros formatos como JPEG.

Y para redondear, DjVu es un formato multipágina. Es decir, en un único fichero se almacenan todas las páginas de nuestro documento. Las páginas pueden ser de distinto tipo: la primera en color y las siguientes en BW, por ejemplo. El paquete de software también incluye otras utilidades adicionales así como un programa visor, DJView, que te permite ver los documentos microfilmados en Linux, pero para eso probablemente te sea más práctico usar Evince.

El programa comercial de Lizardtech es mucho más sofisticado que todo esto. Para que te hagas con la idea, lo que viene a hacer es tomar una página, sea como sea, por ejemplo con mezclas de diferentes tipos de gráficos y texto, y descomponerla adecuadamente para que los diferentes compresores hagan su trabajo, y luego ensamblarlo todo de nuevo en una única página DjVu que parece idéntica al documento original. Todo automáticamente. Puedes ver cómo sería, haciendo pruebas con ficheros PNM en el servidor Any2Djvu, que utiliza software de Lizartdtech para hacer las conversiones gratuitamente a quien lo solicite (eso si, es lento, ya te lo advierto).

Sinceramente, DjVu es tan práctico y eficiente, que he llegado a plantearme comprar el software comercial de Lizardtech. La versión profesional vienen a ser algo más de 300 euros, un poco caro pero asumible si de verdad lo vas a usar. El problema es que la versión profesional solo existe para Windows. Aaaaagh!. Hay otra versión, más avanzada, que es la versión empresarial y que sí incluye software Linux, pero el precio se vuelve inadmisible para un particular. Ya conoceis mi filosofía: no me gusta el pirateo, así que si no lo puedo comprar, no lo uso y punto. Afortunadamente, casi todo lo que vamos a necesitar puede apañarse perfectamente con el software libre de DjVu y unos cuantos scripts. Así que a ello vamos.

Lo que sigue son una serie de scripts personalizados para crear ficheros DjVu y organizarlos en una base de datos. Todo muy práctico para mi mismo, pero seguramente demasiado personalizado para tí, porque tendrás que adaptar o escribir de nuevo todos los scripts para que te funcionen en tu máquina. Al menos, servirá para darte unas cuantas ideas si sabes cómo programar scripts. Si no, seguramente preferirás algo más automático que funcione sin necesidad de hacer ninguna modificación al script, así que mejor échale un vistazo a mi script"escaneo", que lo hace todo de forma simple y automática. De nada. ;-)

Para organizarlo todo, vamos a suponer unas pocas cosas bastante elementales:

  1. Que tienes un escaner funcionando, lógicamente. En mi caso, se trata de un Canon Lide 30 USB, pero podría ser cualquier otro. Esto significa que tienes instalado y configurado SANE, y que el comando "scanimage -L" es capaz de identificar correctamente tu escaner.
  2. Que tienes instalado el programa xhkeys, que permite asignar comandos a una tecla especial del teclado. En el caso de Gentoo, solo tienes que hacer un "emerge xhkeys".
  3. Que arrancas una sesión en modo gráfico. En realidad, no es imprescindible: Para crear documentos DjVu podrías hacerlo todo perfectamente desde una consola (por ejemplo, podrías seguir almacenando documentos mientras está logada tu mujer, o desde una máquina remota de tu red local). Pero sí es necesaria una sesión gráfica para ver los documentos creados, claro. En mi caso, utilizo KDE, pero puede que tú uses otra cosa, como Gnome, o WindowMaker.
  4. Que tienes instalado DjVu, lógicamente. Si no es así, tienes que bajártelo y compilarlo o instalarlo de la forma adecuada para tu distribución Linux. En mi caso es Gentoo, así que me basta con un "emerge djvu", porque está incluido en los repositorios.
  5. No es imprescindible, pero te recomiendo también que instales GSDjVu, que es una utilidad que convierte los ficheros PDF a DjVu. No está incluido en los repositorios ni en el paquete principal de DjVu, porque su licencia es distinta (CPL en lugar de GPL), así que hay que compilarlo aparte. Las instrucciones son muy claras, así que no deberías tener problemas. Esto te proporciona un nuevo comando: "djvudigital", que transforma un PDF a DjVu de alta calidad.

Vale, ahora tienes que crear un archivo ejecutable que se llame /etc/scanbuttond/sbd-scan.sh y que contenga lo siguiente:

#!/bin/bash
device=`scanimage -L | grep plustek | cut -c 9-30`
tmpfile="$HOME/scan/scan"
ancho="215mm"
alto="295mm"
sonido="/usr/share/sounds/radarping.wav"

modo="Lineart"

if [ "$modo" = "Lineart" ]; then
  programa=cjb2
else
  programa=c44
fi

if [ -f $HOME/scan/.num ]; then
	touch $HOME/scan/.num
else
	echo 0 > $HOME/scan/.num
fi

reg=`cat $HOME/scan/.num`
num=`expr $reg + 1`
echo $num > $HOME/scan/.num
if [ $num -lt 100 ]; then
	corr="0"
else
	corr=""
fi
if [ $num -lt 10 ]; then
	recorr="0"
else
	recorr=""
fi
num=${corr}${recorr}${num}
scanimage --device-name ${device} --format pnm --mode $modo \
	 --resolution 300 -x $ancho -y $alto > ${tmpfile}${num}.pnm

$programa ${tmpfile}${num}.pnm ${tmpfile}${num}.tmp
djvm -c ${tmpfile}${num}.djvu ${tmpfile}${num}.tmp
rm ${tmpfile}*.tmp
if [ "$num" = "001" ]; then
	cp ${tmpfile}${num}.djvu ${tmpfile}_fichero.djvu
	chown lacofi:users ${tmpfile}_fichero.djvu
else
	djvm -i ${tmpfile}_fichero.djvu ${tmpfile}${num}.djvu
fi

sudo -u lacofi artsplay $sonido &

Vale, ahora fijaos en las líneas marcadas en color verde. Vamos a comentarlas un poco, porque son las que debeis configurar para vuestro sistema. El resto debería funcionar sin ningún cambio en cualquier ordenador.

En primer lugar, la linea "device=" debe indicar a tu escaner. En mi caso, el Canon Lide 30 es identificado como un Plustek porque usan el mismo chip. Ejecuta un "scanimage -L" a mano para hacerte una idea de cómo es identificado tu escáner y qué cadena tienes que poner después del grep.

En segundo lugar, la entrada "tmpfile" debe apuntar a un directorio vacío y que exista, y dentro de él a una raiz de fichero. Me explico. En mi caso apunta al directorio $HOME/scan, que está vacío pero existe, y a la raiz "scan". A esta raiz, el script irá añadiendo números, de tal forma que se irán creando ficheros tal que $HOME/scan/scan001.pnm, $HOME/scan/scan002.pnm, etc. Cuando ejecutemos el segundo script que explico más tarde, el escaneo termina, el fichero djvu resultante es copiado al directorio definitivo, y luego el directorio $HOME/scan es vaciado de nuevo para que pueda empezar un nuevo escaneo desde cero.

En tercer lugar, la entrada "sonido" apunta a un fichero wav de sonido que exista. Daos cuenta de que el escaneo va a ser todo ciego, es decir, sin teclear comandos ni ver el resultado. Ese sonido servirá de toque de atención, para decirnos en qué momento el sistema está listo para una nueva página. Como uso KDE, el sonido será tocado mediante artsplay. Observad también que llamo a artsplay a traves de sudo. Eso no tiene mucho sentido ahora, pero sí lo tendrá más adelante, cuando integremos este mismo script en el demonio scanbuttond. De momento solo hacedme caso, ¿vale?. Naturalmente, para que sudo funcione, teneis que añadir una linea en /etc/sudoers que diga esto:

%lacofi ALL=(ALL) NOPASSWD: /usr/bin/artsplay /usr/share/sounds/*.wav

Y lógicamente, puede que tú no seas el usuario "lacofi", así que tendrás que sustitulo por tu verdadero login, tanto en la llamada a sudo como en el fichero /etc/sudoers, o incluso meter todo un grupo de usuarios (por ejemplo con "%users").

Ahora teneis que crear otro script idéntico a sbd-scan.sh pero que se llame /etc/scanbuttond/sbd-gris.sh. Es un script idéntico, pero en la línea "modo=" debe poner "Gray" en lugar de "Lineart". Y aún teneis que crear otro script más, que se llame /etc/scanbuttond/sbd-color.sh y que en la línea "modo=" ponga "Color".

Lo se, lo se. Un solo script hubiera bastado, metiendo la variable "modo" en línea de comandos. Pero esta forma de hacerlo con varios scripts será la correcta para cuando más adelante metamos estos scripts en scanbuttond.

Técnicamente ya podemos escanear, pero tendremos que ir tecleando los comandos que arrancan nuestros scripts, y nosotros pretendemos algo mucho más sencillo: que se pueda escanear pulsando una tecla. ;-)

Para eso utilizaremos el programa xhkeys, asignando nuestros tres script a tres teclas del teclado: F10 para escanear en BW, F11 para escanear en Grises, y F12 para escanear en Color. Para ello solo hay que configurar xhkeys:

[lacofi@jeanette ~]$  xhkconf
----------- ADD/MODIFY hot key -------------
Type a key combination you wish to add/modify
Quits if idle within 10 secs
[pulsamos F10]
Unused scan code;modifier:	76;0

Select command type
1. Internal Function
2. Application
3. Plugin Call
4. Key Event
5. Mouse Event
6. Cancel
Enter selection by number, or cap. letter:
[pulsamos 2]
Enter the shell command to call the application:
[Tecleamos: /etc/scanbuttond/sbd-scan.sh]

OSD title types:
        1. Standard (command line)
        2. Custom
        3. Disabled (no OSD message)
Select title type: [Pulsamos 2]
Enter OSD title: [Tecleamos "Facsimil BW"]

Scan code:  76 (0x4c)  State:   0 (0x00)
        OperType:  A [Application]
        OSD title: Facsimil BW
        Command:   /etc/scanbuttond/sbd_scan.sh

Accept? (y, n):  [Pulsamos y]

Repetimos la operación para configurar F11 hacia /etc/scanbuttond/sbd-gris.sh y F12 hacia /etc/scanbuttond/sbd-color.sh. Ahora solo nos queda hacer que un demonio xhkeys se ponga en marcha cada vez que arranquemos la sesión gráfica. En el caso de KDE es muy fácil:

[lacofi@jeanette ~]$ ln -s /usr/bin/xhkeys .kde/Autostart/xhkeys

Después tendremos que salir de KDE y volver a entrar, si queremos activar el demonio xhkeys inmediatamente, claro.

A partir de ahora, para escanear un documento de, pongamos, 10 páginas lo tendremos muy fácil:

  1. Ponemos la primera página en el escáner.
  2. Dependiendo de que sea texto (o texto con gráficos monocromos), gráficos en gris, o gráficos en color, pulsaremos F10, F11, o F12 respectivamente.
  3. Cuando oigamos el pitido de advertencia, significa que el escaneo de la página ha terminado, así que ponemos otra página en el escáner y repetimos la operación.
  4. Y así hasta que el documento esté escaneado por completo. El documento final será $HOME/scan/scan_fichero.djvu. Y eso es todo, puedes moverlo a donde quieras y renombrarlo para que tenga un nombre más decente. Acuérdate de borrar todo el contenido del directorio $HOME/scan antes de escanear de nuevo. Fácil, ¿no?.

Si tienes un escaner con alimentador de hojas, la cosa es mucho más fácil todavía, porque se pueden modificar los scripts para que cuando pulses la tecla empiece a escanear y convertir a formato djvu todas las páginas el solito sin necesidad de hacer nada.

Pero yo no me conformo con eso, naturalmente, así que podemos ir más allá y rizar un poco el rizo. Lo que sigue a partir de ahora es para nota, y completamente opcional. Por decirlo en dos palabras: vamos a crear un nuevo script que lo resetee todo y grabe el fichero DjVu definitivo en el sitio correcto, dejando listo un registro adecuado para importar los datos del documento en una base de datos Tellico. Esto lo haremos a traves del siguiente script:

#!/bin/bash

ejecuta="si"
carpeta=$PWD
raiz=`echo $carpeta| awk -F/ '{ print $2 }'`
clase=`echo $carpeta| awk -F/ '{ print $3 }'`
subclase=`echo $carpeta| awk -F/ '{ print $4 }'`
fichero=$1
database="/var/log/escaneo.csv"
log="/var/log/escaneo.log"
directorio="$HOME/scan"
insertar="no"
ejecuta="si"
valido="si"
campos_tipo=`cat $estructura | grep Campos_tipo`
color="$HOME/.colorscan"

azul="\033[0;34m"
azul_claro="\033[1;34m"
verde="\033[0;32m"
verde_claro="\033[1;32m"
oro="\033[0;33m"
oro_claro="\033[1;33m"
cian="\033[0;36m"
cian_claro="\033[1;36m"
rojo="\033[0;31m"
rojo_claro="\033[1;31m"
blanco="\033[1;37m"
nocolor="\033[0m"

declare -i error1
declare -i error2

function ayuda {
	echo -e " "
	echo -e "${oro}Uso:${nocolor} resetea ${verde}[version]${nocolor} fichero.djvu"
	echo -e " "
	echo -e "${verde}[version] puede ser:${nocolor}"
	echo -e "	${oro}-h o --help${nocolor} 	(saldra esta ayuda)"
	echo -e "	${oro}insertar numero${nocolor} (insertara en la posicion indicada)"
	echo -e "	${oro}agregar numero${nocolor}	(agregara en la posicion indicada)"
	echo -e "	${oro}borrar numero${nocolor}	(borra la pagina indicada)"
	echo -e "	${oro}nolog${nocolor} 		(borra logs anteriores y termina)"
	echo -e "	${oro}anota${nocolor}		(no hace nada, solo anota)"
	echo -e " "
}

function pregunta {
	if [ "$raiz" = "facsimil" ]; then
		if [ "$clase" = "personal" ]; then
			tipo=`echo $campos_tipo | awk -F, '{ print $2 }'`
		elif [ "$clase" = "profesional" ]; then
			case $subclase in
				administracion)
					tipo=`echo $campos_tipo | awk -F, '{ print $3 }'`
				;;
				apuntes)
					tipo=`echo $campos_tipo | awk -F, '{ print $4 }'`
				;;
				protocolos)
					tipo=`echo $campos_tipo | awk -F, '{ print $5 }'`
				;;
				revistas)
					echo "Es un libro (Si/No):"
					read libro
					if [ "$libro" = "si" ] ||
						[ "$libro" = "Si" ] ||
						[ "$libro" = "SI" ]; then
						tipo=`echo $campos_tipo | awk -F, '{ print $6 }'`
					else
						tipo=`echo $campos_tipo | awk -F, '{ print $7 }'`
					fi
				;;
				tutoria)
					tipo=`echo $campos_tipo | awk -F, '{ print $8 }'`
				;;
				*)
					echo "Estas en el directorio $PWD"
					echo "Se supone que no deberías ejecutar eso ahi!."
					echo " "
					ayuda
					ejecuta="no"
				;;
			esac
		else
			echo "Estas en el directorio $PWD"
			echo "y no deberias ejecutar esto ahi."
			echo " "
			ayuda
			ejecuta="no"
		fi
	else
			ayuda
			ejecuta="no"
	fi
	if [ "$ejecuta" = "si" ]; then
		echo "Dime el Autor:"
		read autor
		echo "Dame un titulo:"
		read titulo
		echo "Haz un comentario:"
		read comentario
		if [ "$comentario" = "" ]; then
			comentario=$titulo
		fi
		if [ "$clase" = "profesional" ] &&
			[ "$tipo" != "Libro" ]; then
			echo "Si es una revista, pon cual es:"
			read revista
			if [ "$revista" != "" ]; then
				if [ "$revista" = "Medicina Intensiva" ] ||
					[ "$revista" = "Med Intensiva" ]; then
					export revista="Medicina Intensiva"
					export medint="true"
				else
					export medint=""
				fi
				echo "Pon el volumen:"
				read volumen
				echo "Pon el numero:"
				read numero
				echo "Pon las paginas:"
				read paginas
			fi
		fi
		echo "Pon la fecha (AAAA | MM/AAAA | DD/MM/AAAA):"
		read fecha
		letras=`echo $fecha | wc -c`
		if [ $letras -eq 5 ]; then
			ano=$fecha
			mes=""
			dia=""
		elif [ $letras -eq 8 ]; then
			ano=`echo $fecha | cut -c 4-7`
			mes=`echo $fecha | cut -c 1-2`
			dia=""
		elif [ $letras -eq 11 ]; then
			ano=`echo $fecha | cut -c 7-10`
			mes=`echo $fecha | cut -c 4-5`
			dia=`echo $fecha | cut -c 1-2`
		else
			ano=""
			mes=""
			dia=""
		fi
		fecha=${ano}-${mes}-${dia}
	fi
}

function posicion {
	echo "Debes situarte en el directorio de destino"
	echo " "
}

function indefinido {
	echo "Uuups. Hubo un error."
	echo "Variable1= $1"
	echo "Variable2= $2"
	echo "Variable3= $3"
	echo " "
}

function limpia {
	if [ "$ejecuta" = "si" ]; then
		rm -Rf $directorio/*
		rm -f $directorio/.num
	fi
}

function registra {
	if [ "$ejecuta" = "si" ]; then
		echo " " >> $log
		date >> $log
		echo "-----------------------" >> $log
		echo "Fecha: $fecha" >> $log
		echo "Fichero: $fichero" >> $log
		echo "Directorio: $PWD" >> $log
		echo "Autor: $autor" >> $log
		echo "Titulo: $titulo" >> $log
		echo "Comentario: $comentario" >> $log
		echo "Tipo: $tipo" >> $log
		cod=`echo $tipo | cut -c 1-3`
		if [ "$cod" = "Art" ]; then
			echo "($revista $ano $volumen:$numero:$paginas)" >> $log
			echo "Medicina Intensiva = $medint" >> $log
		fi
		echo '"'$autor'"','"'$titulo'"','"'$PWD/$fichero'"',\
		'"'$comentario'"',$tipo,'"'$revista'"',$volumen,$numero,$paginas,$fecha,\
		Directorio,,,,true,$medint >> $database
	fi
}

if [ $# -eq 0 ]; then
	ayuda
	ejecuta="no"
	valido="si"
else
	case $# in
		1)
			extension=`echo $1 | rev | cut -c -4`
			;;
		2)
			extension=`echo $2 | rev | cut -c -4`
			;;
		3)
			extension=`echo $3 | rev | cut -c -4`
			;;
		*)
			extension="----"
			echo "El numero de parametros no es correcto"
			ejecuta="no"
			;;
	esac
	if [ "$extension" = "uvjd" ] ||
		[ "$extension" = "fdp." ] ||
		[ "$extension" = "fit." ] ||
		[ "$extension" = "ffit" ]; then
		valido="si"
	else
		valido="no"
	fi
fi

case $1 in
	-h|--help)
		ayuda
		;;
	nolog)
		echo "Esta subrutina vaciara el LOG donde se almacenan"
		echo "los datos de todos los escaneos."
		echo " "
		echo "Estas seguro? (Si/No)"
		read respuesta
		if [ "$respuesta" = "si" ] ||
			[ "$respuesta" = "Si" ] ||
			[ "$respuesta" = "SI" ]; then
			echo " " > $log
			echo "Autor,Titulo,Posicion,Descripcion,Publicado en,Revista,\
			Vol,Num,Pag,Fecha,Carpeta,Número,Tipo,Archivo,Facsimil,\
			Medicina Intensiva" > $database
		else
			echo "Ah, creia..."
		fi
		;;
	insertar|agregar|borrar)
		if [ "$ejecuta" = "si" ]; then
		if [ -f "$3" ] &&
			[ "$valido" = "si" ]; then
			mv $directorio/scan_fichero.djvu ./pag$2.djvu
			chmod go-w pag$2.djvu
			error=$?
			if [ $error -gt 0 ]; then
				posicion
				ejecuta="no"
			else
				limpia
			fi
			if [ "$ejecuta" = "si" ] ||
				[ "$1" = "borrar" ]; then
				if [ "$1" = "insertar" ] ||
					[ "$1" = "borrar" ]; then
					djvm -d $3 $2
					error1=$?
				else
					error1=0
				fi
				if [ "$1" = "insertar" ] ||
					[ "$1" = "agregar" ]; then
					djvm -i $3 pag$2.djvu $2
					error2=$?
				else
					error2=0
				fi
				if [ $error1 -eq 0 ] &&
					[ $error2 -eq 0 ]; then
						rm pag$2.djvu
				else
					ayuda
					indefinido
				fi
			fi
		else
			ayuda
		fi
		fi
		;;
	anota)
		fichero=$2
		if [ "$ejecuta" = "si" ] &&
			[ "$valido" = "si" ]; then
			pregunta
			registra
		fi
		;;
	*)
		if [ "$ejecuta" = "si" ] &&
			[ "$valido" = "si" ]; then
			pregunta
			if [ -f "$color" ]; then
				echo "Pronto en sus pantallas"
			else
				mv $directorio/scan_fichero.djvu ./$1
				chmod go-w $1
					error=$?
				if [ $error -gt 0 ]; then
					posicion
				else
					limpia
					registra
				fi
			fi
		fi
		;;
esac

Parece complicado, pero no lo es tanto si tienes un poco de idea de programación Bash (observa que tiene múltiples rutinas en forma de funciones).

Para entender este script y lo que hace, hay que tener en cuenta que guardo todos mis documentos en subdirectorios del siguiente árbol:

[lacofi@jeanette ~]$ tree -d -L 2 -I lost* /facsimil
/facsimil
|-- personal
|   |-- coche
|   |-- comunidad_vecinos
|   |-- docs_bancarios
|   |-- folletos_informacion
|   |-- libros
|   `-- notas_casa
`-- profesional
    |-- administracion
    |-- apuntes
    |-- protocolos
    |-- revistas
    `-- tutoria

13 directories

Partiendo de esta idea básica, este script tiene varias peculiaridades que restringen su funcionamiento y hacen que sea todo muy personalizado. No funcionará en tu sistema, asi que seguramente tendrás que reescribirlo entero, pero eso es precisamente lo más interesante. En cualquier caso, te será útil para darte unas cuantas ideas, a saber:

  1. En caso de error, el script abortará el proceso y sacará en pantalla una ayuda sobre la sintaxis correcta. Puede consultarse la sintaxis ejecutando el script sin argumentos, o con los argumentos -h o --help.
  2. El script no funcionará si no estas en el directorio adecuado (es decir, un subdirectorio de /facsimil/personal o /facsimil/profesional. Si has hecho un "cd" a cualquier otro lugar que no cumpla ese requisito, el script abortará y sacará la ayuda en pantalla.
  3. Si se cumplen las condiciones, el script hará unas cuantas preguntas pidiendo el autor, el título, etc, del documento que se está almacenando. Las preguntas son sensibles a contexto: dependiendo del directorio en que te encuentres, te hará unas preguntas u otras. Por ejemplo, si estás en /facsimil/personal no te preguntará si se trata de una revista. Si es un libro, no preguntará el volumen de la revista, etc. Si se deja en blanco el comentario, el script almacenará el título como comentario. Y así con unas cuantas cosas más. La idea es que el script saque un máximo de información haciendo un mínimo de preguntas.
  4. A partir de todo esto, el script guarda dos logs diferentes:
    1. Uno es /var/log/escaneo.log que es un archivo "legible por humanos" y que contiene toda la información que ha obtenido del usuario y del contexto, para que puedas consultarlo cómodamente en cualquier momento.
    2. El otro log es /var/log/escaneo.csv. Observa las líneas marcadas en verde: aquí lo he puesto en varias líneas para facilitar la lectura en la Web, pero en tu ordenador deberías poner ambas entradas en en una única línea. Lo interesante de este log es que se trata de una base de datos en formato CSV, cuya primera línea es el nombre de los campos. La gracia de esto es que casi todas las bases de datos saben importar ficheros CSV, lo que significa que podemos abrir nuestro programa Tellico y decirle simplemente que importe este archivo. Genial, ¿no?. Con este script ¡nuestra base de datos se rellena sola!. Naturalmente, eso exige que tengamos una base de datos Tellico ya creada y con los mismos campos que estamos introduciendo aquí, pero eso es de cajón.
  5. Además, el script es capaz de distinguir varios formatos de fecha, como: "1994", o "10/1994" (septiembre de 1994) o como "10/10/1994". No aceptará otros formatos. En cualquier caso, el script transforma la fecha así escrita a otro formato distinto, el que usa una base de datos Tellico. :-)

Bien, pues vamos a ejecutar el script:

[lacofi@jeanette ~]$  cd ~/facsimil/protocolos/vm
[lacofi@jeanette vm]$  resetea reclutamiento_sdra.djvu
Introduce el primer autor:

Contestamos tres o cuatro preguntas y ya está. El documento quedará archivado en el directorio adecuado, y $HOME/scan quedará vacío, listo para empezar un nuevo documento. El archivo /var/log/escaneo.log guardará información precisa de lo que ha hecho. Y lo que es más importante, el archivo /var/log/escaneo.csv guardará un nuevo registro CSV que nos permitirá importar todos esos datos en la base de datos Tellico (o cualquier otra que soporte importación de datos CSV).

A veces, si revisais el documento escaneado (djview reclutamiento_sdra.djvu), puede que una página esté mal escaneada, por ejemplo porque haya quedado torcida. No importa. Se escanea de nuevo, pero SOLO la página fallida, y luego se ejecuta "resetea" con el parámetro "insertar".

[lacofi@jeanette vm]$ resetea insertar 14 reclutamiento_sdra.djvu

Con lo que el documento reclutamiento_sdra.djvu es modificado para borrar la página errónea (la 14) y poner en su lugar la nueva página. Esta maniobra no quedará registrada en el fichero de log, claro. Más sencillo no puede ser.

Del mismo modo, podemos agregar una página (en vez de insertarla sustituyendo otra), o incluso borrarla por completo.

Pero ¿qué ocurre si no estamos logados?. ¿Podemos escanear?. Pues sí, claro. Estos mismos scripts (sbd-scan.sh sbd-gris.sh y sbd-color.sh) pueden ser asignados a los botones del escáner mediante el programa demonio scanbuttond. En el caso del Canon Lide 30, tiene tres botones frontales que se supone son para escanear, fotocopiar y enviar por correo electrónico, pero resulta más práctico asignarlos a nuestros scripts, al menos sbd-scan.sh y sbd-color.sh, dejando el botón del medio para fotocopiar. Luego podemos logarnos de forma remota para ejecutar "resetea".

En cualquier caso, la instalación y configuración de scanbuttond está bien documentada, así que no me voy a enrollar con ella. Los usuarios de Gentoo solo tienen que recurrir al gentoo-wiki, como siempre, pero los usuarios de otras distribuciones también deberían echarle un vistazo, porque viene todo muy bien explicado y con mucho detalle. ;-)

Be Sociable, Share!

Puedes seguir cualquier respuesta a esta entrada mediante el canal RSS 2.0. Puedes dejar un comentario o enviar un trackback desde tu propio sitio.

Deja un comentario

Disculpa, debes iniciar sesión para escribir un comentario.