Importazione documenti PDF con estrazione automatica dei campi

Dalla versione 2023.00.15 è disponibile un modello di categoria documentale per l’importazione dei documenti PDF con estrazione dei campi, utilizzabile per l’archiviazione dei file PDF e definire le aree che contengono le informazioni da importare in automatico nei campi del form.

Questo modello può essere utilizzato per la gestione dei documenti del ciclo attivo, come ad esempio le fatture di vendita a clienti estero, i DDT di consegna e gli ordini di acquisto.
In questa tipologia di documenti, dato che la stampa è prodotta dall’ERP, le zone dove andare a intercettare le informazioni sono sempre le stesse, di conseguenza una volta configurato la produttività del tool d’importazione è massima.
Inoltre, questo modello d’importazione può essere utilizzato anche per l’importazione di fatture e DDT del ciclo passivo, con il rilevamento automatico delle informazioni quali la ragione sociale del fornitore, la partita IVA, la data ed il numero del documento, come anche l’importo.

L’utente ha la possibilità di creare diversi modelli di estrazione dati che definiscono le aree nelle quali sono contenute le informazioni, fornendo al sistema il criterio per riconoscere quale modello applicare in base al contenuto del documento PDF, che deve necessariamente essere in formato nativo (non può essere una scansione).

Il riconoscimento dei dati viene effettuato in automatico al momento dell’archiviazione del documento.

Al momento della creazione di un nuovo documento si presenta una scheda come quella riportata di seguito, dov’è possibile selezionare il documento da caricare ed il sistema applica in automatico il modello corrispondente d’estrazione per l’importazione dei dati.

QW07 - Modello estrazione dati per importazione documenti PDF

Al primo caricamento di un documento per il quale non è stato possibile determinare un modello, il menu a tendina del campo Modello si presenta vuoto. Il sistema permette di posizionarsi su ogni campo che si desidera compilare e selezionare il testo sul documento dove si trova la corrispondente informazione. Per ogni campo viene identificata in automatico un’area delimitata da un rettangolo, che può successivamente essere memorizzata per le importazioni future.

Al termine della selezione, col tasto Ricompila può essere eseguita la verifica della validità delle aree definite ed, in caso di necessità, col tasto Salva in nuovo modello si può salvare il modello. Il sistema mostra una scheda dove, oltre al nome dello stesso modello, si può inserire il testo che dev’essere ricercato nel documento per stabilire quale modello applicare. Si suggerisce di utilizzare la ragione sociale del fornitore, così come è riportata sulla fattura o sul DDT.

 

Configurazione delle categorie documentali per l’archiviazione con estrazione automatica dei campi

Il modello della categoria è reperibile nella categoria con codice “_ARCHPDF” non visualizzata nell’albero, con la possibilità d’utilizzarlo su più di una categoria, adattando i campi da estrarre in base alla tipologia del documento. Il form può infatti essere personalizzato modificando i campi gestiti, sia nel tipo di contenuto archiviato sia nel numero degli stessi campi. Questa modifica dev’essere effettuata agendo sui campi contenuti nel contenitore “ContainerDati“, modificando i campi esistenti nel modello o aggiungendone di nuovi.

Inoltre, dev’essere modificato l‘EventoEsegui dell’oggetto procedura AssegnaTitolo per definire la formula con la quale assegnare in automatico il titolo del documento sulla base dei campi inseriti.

QW07 - Configurazione delle categorie documentali per l'archiviazione con estrazione automatica dei campi

I template realizzati possono essere automatizzati grazie alla funzione d’importazione dei documenti di QualiWare Server Daemon. Per approfondimenti, fare riferimento a Importazione metadati da template del servizio Importazione documenti.

 

Riconoscimento automatico dei campi tramite intelligenza artificiale GPT

Se è attivo il modulo QW-CAI – Intelligenza Artificiale è possibile utilizzare l’Intelligenza Artificiale Generativa (GPT) per il riconoscimento automatico dei campi, utile nel caso nessun modello fra quelli definiti risulti applicabile. A questo scopo, si può installare ed utilizzare il template di categoria documentale (Template-archiviazione-fatture-PDF-con-riconoscimento-campi-tramite-GPT.zip), che rappresenta un’evoluzione del form descritto sopra.