Saltar al contenido principal

Documentos

Subir un documento

Los documentos se suben a un expediente desde la vista de detalle o directamente desde una tarea que lo requiera.

  1. Abrir el expediente.
  2. Click en Subir Documento.
  3. Seleccionar el archivo.
  4. El sistema clasifica automáticamente el documento, extrae su metadata y arranca el doc-flow si el tipo lo tiene publicado.

Subir un contenedor (zip / tar)

Cuando subís un zip, tar o tar.gz, Kuatia lo desempaca automáticamente y crea:

  • Un expediente raíz auto-clasificado por contenido.
  • Sub-expedientes para cada carpeta interna.
  • Documentos para cada archivo individual, con clasificación + doc-flow propios.

El zip original NO se guarda como documento. Si querés desactivar este comportamiento, tildá "No expandir contenedor" en el dialog de upload.

Límites de seguridad anti zip-bomb: máximo 10 niveles, 10.000 archivos, 2 GB descomprimidos. Si se exceden, el upload falla.

Formatos no soportados de expansión: RAR, 7z (caen a documento único).

Deduplicación

Kuatia identifica cada archivo por el hash SHA-256 de su contenido. Si subís el mismo archivo dos veces — incluso desde expedientes distintos — el binario se guarda una sola vez en almacenamiento y se crean dos referencias.

La métrica kuatia_document_dedup_hits_total cuenta cuántas subidas evitaron almacenamiento.

Metadata automática

Kuatia aplica extracción tiered sobre el archivo subido. La cobertura llega a 100+ tipos MIME vía un combo de extractores builtin y sidecars especializados.

TierCobertura
Tier 1 — BuiltinPDF (texto + páginas + autor + título), imágenes (EXIF + dimensiones + GPS), Office (Word/Excel/PPT — palabras, hojas, autor, preview), CSV, texto plano, JSON, XML, Markdown, SQL (dialecto detectado), audio (duración, codec, tags ID3), video (duración, dimensiones, codec, FPS)
Tier 2 — SidecarsHEIC/HEIF (Apple), RAW (Nikon/Canon/Sony/...), EPUB / MOBI, LaTeX, PST (Outlook), formatos comprimidos, decompilers, Calibre para libros, pandoc para conversión
Tier 3 — Custom por tenantEl admin puede agregar handlers via WEBHOOK / ENDPOINT / REACT_COMPONENT / IFRAME_URL para tipos verticales (ej. eFactura uruguaya, formatos legales específicos)

Visores inline

El explorador muestra los archivos directamente en el navegador. Cobertura visual:

  • PDF (visor nativo con zoom, búsqueda, paginación).
  • Imágenes (JPG/PNG/TIFF/HEIC/RAW con conversión via sidecar).
  • Video / audio (player nativo).
  • Texto plano, JSON, XML, CSV, Markdown, SQL (con syntax highlighting).
  • Office (DOCX, XLSX) con preview generado.
  • EPUB / MOBI via sidecar Calibre.

Búsqueda

Full-text

La barra de búsqueda usa Typesense (typo-tolerant) sobre filenames, metadata, texto extraído. Resultados instantáneos a millones de documentos.

Semántica (RAG)

Si tu tenant tiene RAG habilitado, podés hacer preguntas en lenguaje natural sobre tus documentos:

"¿Qué contratos de 2025 tienen vencimiento antes de junio?" "Mostrame los cheques de más de $50.000 firmados por María Pérez."

La query se embedda (Ollama nomic-embed-text), se buscan los chunks más cercanos en pgvector, y un LLM (configurable por tenant) sintetiza la respuesta citando los documentos fuente.

Disponible:

  • Como tool del Asistente AI conversacional.
  • Como nodo consultar_documentos en flujos.
  • Como endpoint REST POST /rag/query para integraciones programáticas.

Doc-flow Layer 2 (procesamiento automático del documento)

Si el Tipo de Documento tiene un flujo publicado (ver Administración de Flujos), arranca automáticamente apenas se sube el archivo. Casos típicos:

  • Extracción automática: el nodo extract_with_processor corre un procesador especializado (ej. parser de cheques bancarios uruguayos) que devuelve campos estructurados.
  • Revisión manual: el nodo manual_review_extracted_fields pausa el flow con una tarea para que un operador valide o corrija los campos extraídos.
  • Revisión asistida por IA: el nodo ai_assistant_review abre un chat operador↔IA donde el asistente sugiere atributos y el operador los acepta o agrega los suyos.

El estado del walk se ve en la pestaña Flujo del detalle del documento. Las tareas pendientes aparecen en la bandeja del operador asignado.

Versiones

Cada documento mantiene un versionHistory[] con la lista de versiones. Subir un archivo distinto con el mismo SHA-256 NO crea nueva versión (es el mismo binario). Subir un archivo distinto con el mismo filename en el mismo expediente crea una nueva versión del Document.

ACL fino

Para reglas de acceso a un documento o tipo de documento más allá del permiso por módulo, configurar reglas en Seguridad → Reglas de acceso (cuando ACL está habilitado en el tenant). Permite por ejemplo: este rol puede leer pero no borrar este documento en particular.