Qual è la differenza tra documenti strutturati e documenti destrutturati?

I documenti strutturati sono quelli normalmente prodotti dai sistemi informativi sotto forma di spool di stampa, sequenza di file pdf o xml. Normalmente questi flussi sono creati secondo regole fisse (quntomeno per tipologie o sottotipologie) per cui i documenti hanno ad esempio un numero fisso di righe per pagina ed alcune informazioni, soprattutto quelle di testata e di piede, sono in posizione fissa. Quindi diciamo che questi documenti hanno una struttura “fissa”, sicuramente variabile nel tempo, ma identica per insiemi o sottoinsiemi di documenti. La natura di questi documenti ci consente di trattarli con un insieme di regole da noi contenute in oggetti chiamati volgarmente “schemi”.

Definiamo invece documenti destrutturati tutti quei documenti generati senza regole precise (es.: documenti word) e quei documenti che in alcuni casi inizialmente sono stati creati in forma strutturata da soggetti terzi ma che per chi li deve gestire sono completamente eterogeni (es.: fatture di acquisto). I documenti destrutturati sono quindi tutti quelli ai quali non possiamo applicare regole fisse di gestione. Le informazioni destrutturate possono essere di 2 origini: digitali (word, excel, pdf, power point, mp3, wav, ecc) e cartacee.

Comments are closed.