Il mondo e le nostre vite sono sempre più influenzati dalle tecnologie dell'informazione e della comunicazione, il principale motore dell'attuale progresso tecnologico, modellato intorno alle informazioni e ai dati. La nostra società, la salute, il benessere, l'economia e il governo si basano fortemente sui dati e sulle informazioni, richiedendo quindi metodologie, tecnologie e soluzioni adeguate per affrontare le relative sfide.
Il panorama ICT è stato soggetto a diverse rivoluzioni negli ultimi decenni (ad esempio, cloud, edge, IoT, 5G), con un aumento esponenziale della quantità di dati da raccogliere, analizzare e gestire, con l'obiettivo di raggiungere i GeopByte (2^100 - 10^30 Byte) entro il 2025. Cloud, IoT e 5G sono oggi soluzioni efficaci che innescano la trasformazione digitale e le economie, spostando così gli interessi verso la scienza dei dati, comprese le sue tecnologie e applicazioni. Il paradigma del cloud computing, infatti, è ormai maturo e i sistemi IoT stanno finalmente diventando pronti per la produzione, così come l'Edge computing, che completa il cloud migrando il calcolo ai margini della rete, più vicino ai dispositivi finali. L'avvento delle reti 5G sta poi dando impulso a un'altra rivoluzione ICT, consentendo una nuova ondata di servizi intelligenti basati su un maggiore throughput, una minore latenza e un supporto massiccio di sensori, con numerose applicazioni quali città e comunità intelligenti, Industria 4.0, sistemi di trasporto intelligenti, edutainment, sistemi intelligenti e cognitivi, solo per citarne alcune.
Stiamo andando verso un mondo e una società i cui sistemi e servizi sono costruiti su grandi ecosistemi digitali, caratterizzati dalla necessità di gestire in modo sicuro enormi quantità di dati e informazioni eterogenee. In questo nuovo mondo e società connessi, i sensori e i dispositivi intelligenti fanno parte della vita quotidiana, dalle reti intelligenti ai sistemi di trasporto intelligenti, dalla sanità intelligente alle case intelligenti, e contribuiscono ad aumentare la centralità dei dati nei sistemi e nei servizi moderni.
L'economia digitale così affermata, principalmente e fortemente basata sui dati, è una solida realtà con esempi come Google, Facebook-Meta e molti altri, ormai identificati come capitalismo della sorveglianza sotto il mantra "i dati sono il nuovo petrolio" coniato dal matematico britannico Clive Humby nel 2006. Questo concetto, rinnovato nel 2017 in un articolo apparso sull'Economist, sostiene che "la risorsa più preziosa del mondo non è più il petrolio, ma i dati", descrivendo l'ecosistema data-driven in cui viviamo e interoperiamo, in cui enormi quantità di dati vengono raccolte, condivise e analizzate da molteplici attori che operano all'interno e al di là dei confini organizzativi. Queste tendenze sono in aumento e secondo Statista il mondo intero ha prodotto e consumato un totale di 79 zettabyte, che si prevede cresceranno a oltre 180 zettabyte entro il 2025.
La scienza dei dati, come fondamento di una società guidata dai dati, svolge il ruolo di sviluppare tutte le tecnologie e le applicazioni necessarie a supportare la costruzione di sistemi basati sui dati in ambiti multidisciplinari e sempre più complessi. Le tecnologie e le applicazioni della scienza dei dati sono al centro dei moderni sistemi (distribuiti) e delle catene di fornitura, diventando la pietra angolare per lo sviluppo di una nuova società basata sulle TIC in una moltitudine di domini applicativi, dall'energia alla finanza e al settore legale, dalle smart city ai trasporti e all'automotive, dal cambiamento climatico alla salute, solo per citarne alcuni. La capacità di accedere, gestire e analizzare i dati in modo appropriato e tempestivo può portare a enormi benefici per tutti gli attori, tra cui l'industria, la pubblica amministrazione, gli istituti di ricerca e infine l'intera società. La trasformazione digitale a cui stiamo assistendo sta quindi spingendo verso un ecosistema data-driven che pone forti esigenze di gestione e analisi dei dati, oltre che di protezione degli stessi e di affidabilità del sistema.
In questo scenario, il CINI Lab on Data Science è costruito attorno a quattro pilastri principali:
Governance, affidabilità e sovranità dei dati.
Analisi ed elaborazione dei dati
Architetture e infrastrutture di dati
Scienza aperta e dati aperti
che vengono perfezionati nelle aree di ricerca. Le attività del laboratorio contribuiranno alla Strategia europea per i dati (http://dataspaces.info/common-european-data-spaces/#page-content), che promuove un mercato unico per i dati, costruito su spazi dati comuni europei come "un ambiente in cui i dati possono essere archiviati, elaborati e condivisi in modo affidabile, sicuro e reciprocamente vantaggioso, per creare una fiorente economia dei dati" (Commissione europea, 2020).
Tradotto con www.DeepL.com/Translator (versione gratuita)