Il dataset del progetto AgrImOnIA è online e disponibile in open access

Il dataset del progetto AgrImOnIA è online e disponibile in open access

Il dataset prodotto dal team AgrImOnIA è online e disponibile all’utilizzo! I dati si riferiscono alla Lombardia per il periodo dal 2016 al 2021.

Il dataset del progetto AgrImOnIA

Il dataset prodotto dal team AgrImOnIA è online e liberamente scaricabile (cliccare qui per accedere alla repository di Zenodo) secondo i principi dell’open access. Il dataset contiene dati riguardanti  le concentrazioni di inquinanti atmosferici, le principali variabili meteorologiche e geografiche e di uso del suolo. Sono anche incluse informazioni riguardanti il settore zootecnico in termini di densità di bovini e suini allevati.  I dati sono giornalieri e si riferiscono alla Lombardia per il periodo dal 2016 al 2021 (in particolare le localizzazioni geografiche considerate coincidono con quelle delle stazioni di monitoraggio degli inquinanti atmosferici). Il dataset può essere di particolare interesse per chi intende studiare la qualità dell’aria nella regione Lombardia anche con particolare riferimento all’impatto del settore zootecnico. La realizzazione e pubblicazione del dataset coincide con gli obiettivi fissati per il Work Package 1 del progetto AgrImOnIA.

Il processo di costruzione e di armonizzazione dei dati è descritto in modo dettagliato nel report dal titolo “Agrimonia: a dataset on livestock, meteorology and air quality in the Lombardy region, Italy” (disponibile al seguente link). Inoltre  il codice utilizzato per la costruzione del dataset è disponibile nella pagina GitHub del progetto.

In dettaglio i file disponibili sono i seguenti:

  • Agrimonia_Dataset.csv (disponibile anche in formato .Rdata e .mat): file contenente il dataset finale, costruito unendo le serie temporali giornaliere relative alle variabili qualità dell’aria (AQ), meteorologia (WE), emissioni (EM), animali da allevamento (LI) e caratterizzazione del suolo (LA).
  • Metadata_Agrimonia.csv:  file che fornisce ulteriori informazioni sulle fonti utilizzate, sulle variabili importate, sulle trasformazioni applicate e sulle variabili contenute nel dataset Agrimonia.
  • Metadata_AQ_imputation_uncertainty.csv: file che contiene la stima dell’incertezza giornaliera dei ogni osservazione di qualità dell’aria imputata nel caso di dati mancanti.
  • Metadata_LA_CORINE_labels.csv: file che contiene le etichette e le descrizioni delle classi CORINE Land Cover e relative al tipo di uso di suolo.
  • Metadata_monitoring_network_registry.csv: file che contiene i dettagli sulle stazioni di monitoraggio incluse nel dataset e in particolare: tipo di stazione, codice del comune, tipo di ambiente, altitudine, inquinanti campionati e altre informazioni. Ogni riga rappresenta un singolo sensore, più sensori possono essere installati sulla stessa stazione.
  • Metadata_LA_SIARL_labels.csv: file che contiene le etichette e le descrizioni delle classi SIARL, ovvero il tipo di piantagione presente.

Per citare il dataset utilizzare la seguente dicitura:

Fassò Alessandro, Rodeschini Jacopo, Fusta Moro Alessandro, Shaboviq Qendrim, Maranzano Paolo, Cameletti Michela, Finazzi Francesco, Golini Natalia, Ignaccolo Rosaria, Otto Philipp. (2022). AgrImOnIA: Open Access dataset correlating livestock and air quality in the Lombardy region, Italy (1.0.0) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.6620530

Di seguito viene riportata una dashboard completamente navigabile dove è possibile selezionare una o più stazioni e visualizzare una o più serie storiche delle concentrazioni degli inquinanti atmosferici così come riportati nel dataset AgrImOnIA.