Paperless-ngx: el estudio que apagó la resma automática
18.000 hojas por año imprime un estudio contable chico. Paperless-ngx clasifica facturas con OCR, aprende de cada corrección y encuentra un comprobante en ocho segundos. Sin límite de páginas, sin abono mensual.
Un estudio contable de San Rafael con 340 clientes vitivinícolas imprimió 18.000 hojas en 2025. La factura del proveedor lo deja claro: $340.000 en resmas entre enero y diciembre. Cada mes llegaba la misma caja de papel sin que nadie la pidiera. El encargado de compras la recibía, la apilaba junto al tóner de repuesto y seguía con otra cosa.
Dieciocho mil hojas. Tres carpetones por cliente.
La resma que se pide sola cuesta más que el software que la elimina
Traducido a horas: alguien abre el sobre, clasifica la factura, la archiva en el bibliorato físico, la busca tres meses después para una consulta de AFIP y descubre que está mal foliada. La hoja A4 impresa tiene una vida útil de una consulta. Después es lastre.
En Argentina hay 118.000 profesionales en ciencias económicas matriculados, según la FACPCE. Si cada estudio chico imprime 10.000 hojas al año —una estimación conservadora al lado de las 18.000 del caso sanrafaelino— el volumen físico roza los 1.200 millones de hojas anuales. Son horas de búsqueda, superficies ocupadas, flete de archivo muerto y riesgo de fiscalización con comprobantes ilegibles.
El dato global: la consultora IDC reporta que el trabajador de oficina pierde entre el 20% y el 30% de su tiempo buscando documentos. En un estudio de dos personas, media jornada diaria se va en encontrar papeles.
El scanner más rápido genera archivos ilegibles más rápido
Una imagen escaneada y guardada en //servidor/contabilidad/clientes/BodegaLosAndes/2025/IVA/ no se encuentra cuando ARCA intima por un comprobante de hace catorce meses que pasó por tres manos distintas. Sin OCR, sin tags, sin índice, el archivo digital es tan mudo como la caja de cartón.
Los servicios cloud de gestión documental cotizan entre USD 0.40 y USD 0.80 por página procesada. El estudio de San Rafael evaluó tres. A 18.000 páginas anuales, la cuenta mensual trepaba a USD 900, más IVA, más dólar tarjeta. El costo del SaaS se comía lo ahorrado en resmas.
El antagonista es el circuito silencioso que empieza cuando una factura llega por correo y termina, seis pasos después, en una caja polvorienta rotulada "2019 A-F". Nadie diseñó ese circuito.
Paperless-ngx sobre una Mini PC: el stack que cuesta dos resmas por mes
Paperless-ngx es un sistema de gestión documental de código abierto. Corre sobre Docker. El motor de OCR es Tesseract, que procesa español sin problemas. Clasifica documentos por contenido, no por nombre de archivo. Aprende de las correcciones del usuario: cuando el contador asigna "Factura IVA Bodega Los Andes" a un PDF cualquiera, los siguientes documentos similares van solos a esa categoría.
El hardware para un estudio de este tamaño es una Mini PC de $380.000 —un Beelink con 16 GB de RAM y SSD de 512 GB— o un equipo reciclado del propio estudio con Linux. El consumo eléctrico ronda los 15 W, menos que el cargador de un celular.
La pila concreta:
- Paperless-ngx en Docker Compose. Levanta en 20 minutos sobre Debian 12 o Ubuntu Server.
- Tesseract 5 para OCR en español. Reconoce facturas electrónicas argentinas con layout estándar AFIP.
- PostgreSQL 16 como base de datos de metadatos.
- Apache Tika opcional para extraer texto de PDFs ya digitalizados, Word y Excel.
- Tailscale o Netbird si el contador necesita acceso remoto a la Mini PC desde su casa.
El costo de implementación no desaparece. Entre la instalación, la configuración de flujos de etiquetado, la carga inicial de documentos históricos y una capacitación de dos mañanas, el proyecto ronda los USD 800 a USD 1.200. Lo que antes se pagaba en dos meses de resmas, tóner, scanner y horas de archivo.
Tres cosas que conviene saber antes de largar el papel
Primero: el OCR no lee cualquier cosa. Las facturas viejas, escaneadas torcidas, con anotaciones en birome o manchadas de café producen texto basura. El primer mes de carga necesita revisión humana. Un pasante de la facultad de económicas alcanza para esa tarea. Sin esa supervisión, los metadatos quedan sucios y la búsqueda devuelve ruido.
Segundo: el backup no pertenece a la Mini PC. Si el disco de la Beelink muere, muere todo. El backup automático con Borg o Restic a un NAS externo o a un disco USB rotativo es parte del proyecto, no un extra opcional. Sin backup, Paperless-ngx es un archivo digital tan frágil como el bibliorato de cartón.
Tercero: el papel entrante sigue existiendo. Las notificaciones de ARCA, las cédulas judiciales y algunos trámites bancarios llegan en sobre. El objetivo es que cada papel que entra se digitalice en menos de cinco minutos y el original vaya directo a una caja de archivo muerto que se vacía una vez por año.
Para un estudio contable argentino, reemplazar la resma automática por un motor de OCR que aprende los nombres de los clientes equivale a quitarse de encima una tarea sin dueño, que insume medio día por jornada y que explota la semana antes de cada vencimiento de IVA.
El contador de San Rafael hizo la prueba: cargó 47 facturas de un mismo cliente en Paperless-ngx, las etiquetó a mano durante la primera tarde y dejó que el sistema clasificara las siguientes 150 solo. Funcionó con 143. El jueves a las seis de la tarde, cuando ARCA pidió el comprobante 0003-00214567, tardó ocho segundos en encontrarlo.
El pocillo de café estaba caliente.