La gestione dei dati e la configurazione degli ambienti di analisi rappresentano fasi critiche e dispendiose in termini di tempo nel ciclo di vita della ricerca.

L'Ambiente di Ricerca Virtuale (Virtual Research Environment, VRE) di IPSES è stato sviluppato per superare queste sfide, offrendo ai ricercatori un'infrastruttura integrata che riduce la distanza tra la scoperta dei dati e la loro elaborazione. 

La VRE è un servizio avanzato, a disposizione degli utenti registrati, progettato per ottimizzare il flusso di lavoro computazionale e facilitare l'analisi riproducibile.

 

Funzionalità e Architettura della VRE

L'ambiente di ricerca virtuale di IPSES è basato su JupyterLab, un'applicazione web interattiva per la creazione e la condivisione di documenti computazionali (noti come "notebook"), codice e dati. In pratica, la VRE fornisce a ogni utente un'istanza personale, multi-sessione e persistente di questo ambiente. 

Questo spazio di lavoro, accessibile via browser, funge da laboratorio computazionale privato dove è possibile integrare dati provenienti dal portale IPSES con dataset esterni forniti dall'utente. La persistenza dell'ambiente garantisce che file, notebook, script e librerie Python personalizzate rimangano disponibili tra le sessioni, assicurando la continuità e la riproducibilità del lavoro di ricerca.

La VRE offre un ambiente di calcolo potente, flessibile e riproducibile, le sue principali funzionalità includono:

  • Integrazione con il Portale IPSES: Un'interfaccia diretta permette di trasferire i riferimenti ai dati (bookmark) selezionati nella GUI di IPSES direttamente nello spazio di lavoro della VRE, eliminando la necessità di download manuali.

  • Accesso Programmabile ai Dati: La VRE fornisce strumenti che facilitano l'interazione con i servizi della piattaforma, permettendo di recuperare programmaticamente i dati associati ai bookmark per l'utilizzo in script personalizzati.

  • Strumenti di Analisi e Visualizzazione: L'ambiente è pre-configurato con librerie standard per l'analisi dati (pandas) e la visualizzazione (plotly, ipyleaflet), consentendo la rapida generazione di plot e mappe interattive.

  • Ambiente Estensibile: Gli utenti hanno la facoltà di installare librerie Python aggiuntive tramite pip, personalizzando l'ambiente per soddisfare requisiti di analisi specifici e garantendo la flessibilità necessaria per diverse metodologie di ricerca.

Scenario flusso di lavoro :

  1. Selezione Dati: L'utente identifica e seleziona dataset di interesse attraverso la GUI di IPSES, salvandoli come bookmark.

  2. Trasferimento all'Ambiente di Analisi: Attraverso la funzione "Share" nella GUI, i riferimenti ai dati vengono resi disponibili all'interno della VRE.

  3. Accesso alla VRE: L'utente accede alla propria istanza JupyterLab dalla propria area personale .

  4. Elaborazione Dati: Utilizzando uno script Python in un Jupyter Notebook, l'utente carica i dati dai bookmark tramite le funzionalità fornite dalla piattaforma. I dati possono essere combinati con altri dataset (es. file CSV locali caricati nello spazio utente).

  5. Analisi e Visualizzazione: I dati vengono elaborati e analizzati. I risultati possono essere visualizzati, ad esempio, generando mappe di distribuzione di stazioni o grafici di serie temporali.