Il termine inglese per i dati non strutturati è "unstructured data". Si tratta di informazioni digitalizzate in forma grezza non strutturata. Hanno una struttura che non può essere identificata o direttamente utilizzata dai programmi informatici. A differenza dei dati strutturati, le informazioni non possono essere mappate in schemi di database relazionali orientati su righe e colonne. Esempi tipici di dati non strutturati includono dati audio, dati video, immagini, testi, presentazioni o commenti sui social media.
Poiché l'accesso alle informazioni presenti nei dati non strutturati è fortemente limitato per i programmi informatici [...], le possibilità di elaborazione e analisi automatica sono limitate. Per trovare le informazioni rilevanti ed elaborare i dati, è necessario prima estrarre una struttura dai dati. Nell'ambiente IT, esistono numerose applicazioni e concetti per strutturare, memorizzare, leggere, analizzare ed elaborare dati non strutturati.
Differenziazione tra dati non strutturati, semi-strutturati e strutturati
A seconda del grado di strutturazione, è possibile una differenziazione di base dei dati nelle seguenti tre categorie:
- dati strutturati,
- dati semistrutturati,
- dati non strutturati.
Mentre i dati non strutturati non hanno una struttura di dati precisa [...], i dati semi-strutturati hanno un quadro strutturale di base. Un tipico esempio di dati semi-strutturati sono le e-mail. Hanno campi di dati strutturati nell'intestazione, nel campo per l’indirizzo del mittente e dei destinatari, nell'oggetto e altre informazioni. Tuttavia, il messaggio effettivo è sotto forma di dati non strutturati.
Nel caso di dati strutturati, il formato e la struttura dei dati sono predefiniti. Tutte le informazioni possono essere quidni organizzate in campi di dati. Se i dati strutturati sono immagazzinati all’interno di [...] database, le informazioni hanno posizioni specifiche di righe e colonne e hanno relazioni definite con altre informazioni. I programmi per computer possono accedere e modificare i singoli pezzi di informazione in base alla struttura. Linguaggi come SQL (Structured Query Language) sono usati per leggere ed elaborare i dati.
(Fonte: Storage-Insider.de)
Volumi di dati nel progetto pilota KULTIVAS
Un fattore decisivo per il progetto pilota KULTIVAS sono questi dati. Diverse istituzioni possiedono dati storici e geolocalizzati sulla coltivazione delle mele in Alto Adige. Sono proprio questi set di dati che verranno utilizzati nel progetto pilota KONVERTO KULTIVAS a beneficio dell'industria delle mele in Alto Adige. Utilizzando tecniche all'avanguardia, tutti i dati rilevanti saranno sistematicamente strutturati, uniti in un unico database e analizzati. L'obiettivo del nuovo progetto pilota KULTIVAS è quello di fornire una piattaforma efficiente in termini di tempo e di costi per l'agricoltura locale.