Le fasi del processo

Fase 1

Valutare diverse piattaforme di riconoscimento ed estrazione dati da un documento, compresa la possibilita’ di implementarne una con opencv o altri strumenti. Tramite modelli di A.I. il documento viene classificato ed in base alla classificazione riconosciute le parti che lo compongono.

I documenti potranno essere di diverso tipo: strutturati o non strutturati o solo informativi. I documento strutturati possono essere fatture, ordini, ricevute, ecc… ma con formati e design diversi perchè provenienti da diverse ditte. Questi documenti vengono scomposti in ontologie tramite metodologie come GCN o R-GCN e poi presi gli elementi e caricati nella struttura SQL del sistema, scatenando i necessari eventi per gestirne il flusso.

I documenti non strutturati vengono scomposti anche essi, ma memorizzati in una struttura dati più consona ad una ricerca di tipo semantico, con una classificazione per importanza. Qui possiamo usare metodi per identificare le distanze tra le ontologie come “Resnik Semantic Similarity” o “Minkowski Distance metrics” in modo da avere un sistema di ricerca più preciso. Pensiamo di utilizzare un database a grafo per supportare le relazioni ontologiche dei documenti.

Progettazione di un meta linguaggio per definire l’evento ed il flusso da scatenare a seconda del tipo di documento e del tipo di dati che contiene

Definizione di una interfaccia visuale che permetta di creare i flussi documentali automatizzati

Progettazione di una infrastruttura cloud e scelta degli ambienti di programmazione necessari allo sviluppo del progetto

Fase 2

Creazione dell’infrastruttura cloud in modalità test e produzione tramite Terraform o CloudFormation e sistema DevOps con automatismi di deployment dei sorgenti sulla piattaforma

Fase 3

Backoffice per amministrare il sistema, definire gli utenti ed i privilegi.

Interfaccia visuale per creare i flussi documentali automatizzati ed assegnare i componenti del documenti ai dati SQL strutturati

Creazione di API per la gestione del workflow automatico. Le API permettono l’integrazione a sistemi esterni

Creazione di una UI per inviare e ricevere i dati dal sistema di workflow

Interfaccia per permettere la correzione e valutazione di un documento che il sistema non e’ riuscito a riconoscere. Il sistema impara la struttura dei dati di quel tipo di documento per poi gestirlo in modo autonomo.