Nonostante l'Informatica abbia contribuito in modo sostanziale alla rivoluzione post-genomica, i principi di base mediante i quali i sistemi biologici acquisiscono, rappresentano ed elaborano l’informazione necessaria per la loro vita sono ad oggi, nella migliore delle ipotesi, solo abbozzati.
Mettere a fuoco con esattezza tali meccanismi informazionali fondamentali - già affrontati da lungo tempo in una prospettiva più specificamente biologica nell'ambito delle Scienze della Vita - è tra i compiti più impegnativi che l'Informatica si trova a fronteggiare. E’ quindi necessario uno sforzo coordinato e in collaborazione con chi opera nelle Scienze della Vita per comprendere come teorie e tecniche, proprie dell'Informatica, possano essere applicate in contesti biologici e medici.
Per molti problemi classici delle Scienze della Vita, le metodologie informatiche oggi usate richiedono un’evoluzione, dato il significativo cambiamento di paradigma che ha avuto luogo. Due sono le problematiche principali che necessitano di un nuovo contributo informatico in termini sia scientifici che ingegneristici:
- La prima è la grande quantità di dati attinenti le Scienze della Vita disponibili in banche dati della più svariata tipologia. Le attuali tecnologie sperimentali ad elevato rendimento (high-throughput) quali, ad esempio, NGS (Next Generation Sequencing), ChIP-Seq, etc., producono quantità enormi di dati. Per la loro analisi, l'efficienza algoritmica, sia in termini di tempo che di spazio, è centrale. Analogamente, la disponibilità di notevoli quantità di dati rende un problema arduo la definizione di modelli computazionali affidabili. In aggiunta, per molti domini applicativi relativi alle Scienze della Vita, è essenziale per gli utenti finali la disponibilità di metodi semanticamente ricchi e computazionalmente efficienti per la scoperta e rappresentazione di conoscenza biologica, includendo la correlazione tra dati genetici e dati clinici.
- La seconda è una problematica più metodologica. Tradizionalmente la ricerca nel campo delle Scienze della Vita è basata su approcci bottom-up, che hanno la caratteristica di funzionare bene nei sistemi lineari o additivi, ma di avere enormi limitazioni nei sistemi complessi quali, è ormai chiaro, sono la maggior parte dei sistemi biologici. Il concetto di sistema lineare vs. sistema complesso non è così ovvio nel mondo delle Scienze della Vita. Prima di "ipotizzare" collegamenti e interazioni tra i componenti del sistema, gli approcci bottom-up sono orientati a studiare i dettagli (ad es. singoli geni e singole proteine), cosa che è sicuramente importante ma non permette di identificare le proprietà "peculiari" che, nei sistemi complessi, possono solo emergere studiando le interazioni tra i componenti del sistema. L’idea non è quella di suggerire un cambiamento drastico nel modo di fare ricerca, ma di promuovere un’integrazione tra le due metodologie, in modo che approcci top-down, o comunque più “olistici”, possano essere utilizzati fin da subito per supportare ed indirizzare in modo strutturato la ricerca sperimentale, che rimane ovviamente un requisito indispensabile.
La motivazione strategica per l’istituzione di questo laboratorio è riunire la totalità delle strategie d'indagine sviluppate negli ultimi venti anni in Bioinformatica e le relative comunità di ricerca informatica, andando dagli algoritmi, ai modelli, fino ai sistemi formali, per costituire la massa critica indispensabile per affrontare problemi di tale portata e condurle ad una sempre maggiore collaborazione con le comunità di biologi e medici.