¿Cómo puedo escanear un documento TIFF o PDF multipágina en Ubuntu?

Próximo a ganar las Elecciones por tercera vez, Juan Perón se extiende en una entrevista televisada, y entre mútiples asuntos tocados en lo referente al quehacer de la República,describe un programa para escaneo multipágina en Ubuntu: el GScan2PDF.

(...)
Indudablemente que la llegada al poder impone una actualización político-doctrinaria que tiene como eje principal el uso de herramientas tecnológicas libres en beneficio del Pueblo. Toda acción en pos de nuestro objetivo es legítima, y por ello no hemos escatimado esfuerzos cada uno de los estamentos de la Conducción. Viet-nam, el Líbano, Marruecos y el Perú son dignos espejos donde hemos de mirarnos para contemplar las luchas que - como la nuestra - retumban en todo el globo. Los sucesos recientes no han hecho más que persuadirme de ello, sobre todo cuando logramos torcer el brazo del Capitales al poder utilizar software libre para nuestras tareas masivas de escaneo.

Como primer medida es ineludible comprobar que nuestro escáner funcione, desde el punto de vista mecánico y desde el punto de vista técnico. Es opresivo el hecho de que muchos escáneres nos llegan munidos de controladores y software de escaneo especialmente maquinados para los sistemas operativos oligárquicos. En el mundo libre en el cual vivimos, pretendemos utilizar librerías estandarizadas libres para escanear tales como la llamada SANE, distribuida con muchos Linux. Ahora bien, nuestro sistema hará uso de SANE (algo así como "Acceso al Escaner Ahora Fácil"), toda vez que queramos emplear algún dispositivo de exploración óptica, conformando una capa de abstracción (API) de manera similar a aquella conocida como TWAIN o WIA en el oligárquico Window$.

Por tal motivo es también imprescindible comprobar que nuestro escáner se comunique adecuadamente con nuestro sistema a través de la API SANE. Sabremos ello si lo encontramos en la lista de dispositivos oficialmente soportados, aquí. Indudablemente puede suceder que el dispositivo no figure en la lista pero aún así sea reconocido sin problemas por Ubuntu a través de SANE. Por otro lado. si tenemos una multifunción Epson podremos encontrar ayuda operativa para su escáner integrado en una ya clásica explicación que les dí a los muchachos de los gremios gráficos, aquí.

A fin de comprobar el organismo escáner/SANE/Ubuntu, podremos comprobar el funcionamiento incorporando uso a algún software de características sencillas y acotadas a la cadena, tal como Simple Scan. Para instalar esta útil herramienta de software libre, abrimos una terminal con Ctrl+Alt+T e ingresamos

sudo apt-get install simple-scan

Una vez ingresada nuestra contraseña e instalado el programa, podremos correrlo desde Aplicaciones / Gráficos / Simple Scan.

Simple Scan, si bien es sencillo, cuenta con la posibilidad de estructurar algunos trabajos multipágina. No obstante, en la dimensión de los softwares de escaneo chocaremos con la misma segmentación patente en los Movimientos Políticos. Existen softwares libres como Simple Scan o el más completo XSane, orientados a un nivel táctico (escanear un par de documentos), mas si nuestro anhelo comprende la realización de documentos más extensos, usar equipos provistos de alimentador de hojas, etc, habremos de organizarnos, buscando herramientas más especializadas. Con este fin, sugiero evaluar el gscan2pdf. Aquí lo horrible del nombre es inversamente proporcional a la utilidad del programa, pues se trata de un software libre de muy buena factura pensado para la creación de documentos en formato Adobe PDF multipágina, TIFF multipágina, JPEG, PNG o el formato de documentación abierta DjVu.

Para instalarlo desde la terminal ingresamos:

sudo apt-get install gscan2pdf tesseract-ocr-spa unpaper
djvulibre-bin

Una vez descargado el paquete, lo ejecutaremos desde Aplicaciones / Gráficos / gscan2pdf.

g2scan2pdf es modular, ya que se le puede incorporar la función de post-procesamiento "limpieza de papel" y motores de OCR (reconocimiento óptico de caracteres). Estos módulos nos permitirán convertir las imágenes de páginas impresa a texto editable en nuestro equipo, con tres motores de reconocimiento: GOCR, Tesseract. y OCRopus.

Si desean guardar documentos en el formato DjVu, también podrán hacerlo gracias al módulo correspondiente que ya han instalado.

Una vez encendido el escáner, arrancamos el programa. En la barra de tareas presionamos el botón "Escanear" y podremos configurar las propiedades de impresión. Allí podremos elegir el tipo de documento (por ejemplo, True Gray o Escala de Grises para acelerar el escaneado de documentos). Podremos ajustar la resolución deseada, con 200 o 300 dpi tendrán suficiente para un armónico reconocimiento de caracteres y múltiples páginas.


SI EL ESCÁNER NO ES RECONOCIDO POR UBUNTU
En el eventual caso que nuestro escáner no funcione adecuadamente en el sistema de la libertad, el Justicialismo nos tirará una soga por medio de la librería libsane-extras, que no viene instalada por defecto pero contempla varios modelos de escáner adicionales, y podría servirnos para hacerlo funcionar.

Lamentablemente su instalación y configuración tendremos que hacerla manualmente, por lo que como Conductor os indicaré el procedimiento. Encendemos el escáner, vamos a la Terminal y en la consola ingresamos el siguiente Comando de Organización:

sane-find-scanner

Nos debería devolver alguna información, indicando por ejemplo el modelo detectado. Luego instalaremos la librería libsane-extras, con el siguiente Comando:

sudo apt-get install libsane-extras

Nos pedirá la contraseña de Conductor de Ubuntu y se instalará. Como corolario habremos de editar el archivo dll.conf. Desde la Consola debemos ingresar el siguiente Comando de Organización:

sudo nano /etc/sane.d/dll.conf

Debemos desplazarnos en dicho archivo hasta encontrar una sección indicada con las siguientes líneas:

# The following backends are not part of the SANE distribution
# but are provided by the libsane-extras Debian package

(Esto significa "los siguientes controladores no son parte de la distribución de SANE, pero son provistos por el paquete libsane-extras"). Dentro del archivo dll.conf y a continuación de esa mencionada proclama, verán listados toda una serie adicional de escáneres. Si el nuestro en particular se encuentra entre ellos, para que funcione debemos borrar el caracter "numeral" ("#") que se encuentra por delante de su nombre y guardar el archivo. Acto seguido reiniciamos Ubuntu y si todo sale bien, nuestro escáner ahora debería activarse gracias a libsane-extras.


ESCANEO MASIVO POR CONSOLA EN UBUNTU
El Justicialismo es para todos, desde los más novatos que usan interfaces gráficas y programas hasta los expertos nerds adictos a la consola terminal y a las series como Star Trek y juegos como HALO.

Quienes sientan la necesidad de velocidad y amen los desafíos, pueden probar escanear desde un dispositivo munido de alimentador automático de páginas a través de la consola. Para ello habrán de instalarse el sane-utils, un megaprograma que controla el escáner desde la Terminal. Lo hacemos con el siguiente comando:

sudo apt-get install sane-utils

Luego cargamos todas las hojas en el alimentador del escáner, y disparamos el proceso con la siguiente orden:

scanimage -y 279.4 -x 215.9 --batch --format=tiff --mode Lineart --resolution 300 --source ADF

Y haremos realidad efectiva el hecho de que nuestro escáner con alimentador trague con la velocidad del rayo un lote de páginas A4 a 300DPI, explorándolas en blanco y negro y guardándolas en nuestra carpeta en formato TIFF.