Tu sei qui

Data Science

Attività di ricerca

In collaborazione con l'Università di Pisa, la Scuola Superiore Sant'Anna, l’IMT di Lucca, il CNR.

La scienza dei dati sta emergendo come conseguenza dirompente della rivoluzione digitale. Basata sulla combinazione della disponibilità di "big data", di tecniche di analisi dei dati sofisticate e di infrastrutture di calcolo scalabili ad alte prestazioni, la scienza dei dati sta cambiando rapidamente il nostro modo di fare business, socializzare, condurre ricerche e governare la società. Sta anche cambiando il modo in cui viene condotta la ricerca scientifica. Gli approcci basati sui modelli sono integrati da approcci basati sui dati.

È emerso un nuovo paradigma, in cui teorie e modelli e la scoperta di pattern bottom-up (dai dati alla conoscenza) coesistono e si rinforzano a vicenda. Esperimenti e analisi su enormi basi di dati diventano funzionali non solo alla validazione di teorie e modelli esistenti, ma anche alla scoperta di pattern emergenti dai dati, che possono aiutare gli scienziati a progettare teorie e modelli migliori, fornendo una comprensione più profonda della complessità dei fenomeni sociali, economici, biologici, tecnologici, culturali e naturali.

La scienza dei dati è un paradigma interdisciplinare e pervasivo che mira a trasformare i dati in conoscenza, nata all'intersezione di una varietà di campi scientifici e tecnologici: basi di dati e data mining, apprendimento automatico e intelligenza artificiale, sistemi complessi e scienza delle reti, statistica e fisica statistica, recupero delle informazioni e text mining, comprensione del linguaggio naturale, matematica applicata. Progressi spettacolari si stanno verificando nella scoperta di pattern dai dati (pattern mining), nell'apprendimento automatico di modelli predittivi (machine learning) e nell'analisi di reti complesse (network science).

In questo contesto, il dottorato di ricerca in Scienza dei dati si prefigge lo scopo di educare la nuova generazione di ricercatori a in grado di combinare le proprie competenze disciplinari a quelle di uno "scienziato dei dati", capace di sfruttare dati e modelli per far progredire la conoscenza nelle proprie discipline o all’interfaccia fra discipline diverse. A questo scopo, il dottorato in Scienza dei dati sviluppa un mix di conoscenze e competenze sui metodi e sulle tecnologie per la gestione di grandi quantità di dati, eterogenei e complessi, per il rilevamento dei dati (come raccogliere dati), per l'analisi dei dati e il mining (come dare senso ai dati), per la visualizzazione dei dati e la loro narrazione (come raccontare i dati), per comprendere le sfide etiche e l'impatto sociale della Scienza dei dati. I dottorandi avranno l'opportunità di sviluppare progetti di scienza dei dati in una varietà di campi, tra cui:

  • Scienza dei dati per la società e la politica
  • Scienza dei dati per l’economia e la finanza
  • Scienza dei dati per la cultura e le scienze umane
  • Scienza dei dati per l'industria e la produzione
  • Scienza dei dati per la biologia e la salute
  • Scienza dei dati per le scienze dure e ambientali
  • Etica e aspetti legali della scienza dei dati
  • Tecniche e metodi della scienza dei dati

Il dottorato sfrutta la massa critica dei laboratori e dei ricercatori di scienza dei dati presenti a Pisa fin dagli inizi del 2000, nell'Università di Pisa, negli istituti ISTI e IIT del CNR (Consiglio Nazionale delle Ricerche), nella Scuola Normale, nella Scuola Sant'Anna e nella Scuola IMT di Lucca. Questi laboratori hanno dato vita a progetti europei pionieristici nell'analisi del big data e nella scienza dei dati, nonché ai primi programmi formativi per i data scientist a livello di lauree magistrali e di dottorato. Nel 2015, la Commissione europea ha scelto questo hub come coordinatore dell'infrastruttura di ricerca europea per la Big Data Analytics & Social Mining, SoBigData (www.sobigdata.eu) . Questa iniziativa fornisce un ecosistema di dati, analisi e competenze a supporto della scienza interdisciplinare dell’open data e dell'innovazione basata sui dati, in un quadro etico di trasparenza, privacy e responsabilità. SoBigData offre una piattaforma unica per la formazione dottorale in Data Science, riconosciuta dal Ministero dell'Istruzione, dell'Università e della Ricerca, dove i dottorandi possono svolgere ricerche multidisciplinari basate su dati.

Il dottorato in Scienza de Dati accetta domande di iscrizione da parte di studenti laureati in qualsiasi disciplina. Ci si aspetta che il candidato di successo possieda una solida motivazione e preparazione personale e una forte propensione agli studi quantitativi nel proprio campo.

Attività didattica

L'insegnamento si articola in due linee principali: allineamento delle competenze in materia di scienze dei dati, per creare un terreno comune per studenti con background diversi, e applicazioni della scienza dei dati in contesti disciplinari e multidisciplinari. Per l'allineamento, i dottorandi avranno l'opportunità di seguire corsi selezionati offerti dal Master post-laurea in "Big Data Analytics and Social Mining" (Master Big Data) dell'Università di Pisa, in collaborazione con CNR, Scuola Normale, Scuola Sant'Anna e SoBigData.eu.

I corsi disponibili coprono le basi di Data Science e Big Data Analytics:

  • Big Data Sensing & Procurement (Web Crawling analitico, Scraping, Web Search e Information Retrieval, Annotazione semantica del testo, Big Data Sources, Crowdsensing)
  • Big Data Mining (Data Mining, Machine Learning e Statistical Learning, Network Science e Social Network Analysis, Mobility Data Analysis, Web Mining, Nowcasting, Sentiment Analysis e Opinion Mining)
  • Big Data Storytelling (visualizzazione, analisi visuale, data journalism)
  • Big Data Ethics (Privacy-by-design, norme sulla protezione dei dati, Data Science responsabile, aspetti legali della scienza dei dati)
  • Big Data Technologies (gestione dei dati per la business intelligence, High Performance & Scalable Analytics, piattaforme NO-SQL Big Data).

Un'ampia varietà di corsi di dottorato incentrati sulle applicazioni multidisciplinari della scienza dei dati è offerta dalle istituzioni partecipanti, anche in sinergia con  programmi di dottorato già esistenti. Gli studenti hanno anche l'opportunità di partecipare a summer school organizzate in collaborazione con istituti di ricerca internazionali e al programma PhD + dell'Università di Pisa, per lo sviluppo di capacità imprenditoriali e di innovazione.

I dottorandi del corso in Data Science concorderanno annualmente con il Coordinatore del dottorato un piano di studi da presentare al Consiglio di Classe. Tale documento specificherà le attività di ricerca e formazione pianificate per l'anno accademico in corso. I corsi saranno scelti per ampliare e allineare il background degli studenti e approfondire aspetti specifici legati al progetto di tesi di dottorato. I dottorandi devono frequentare almeno tre corsi (oltre alle attività di allineamento) e superare gli esami corrispondenti. Tutti i corsi saranno tenuti in inglese.

I laboratori di ricerca delle istituzioni partner offrono un'ampia rete di relazioni internazionali. SoBigData.eu è un gateway verso una rete di centri di scienza dei dati in Europa e presenta un programma di scambio studentesco transnazionale finanziato dalla Commissione europea nell'ambito del programma H2020 Excellent Science. La rete SoBigData comprende attualmente: ETH Zurich, King's College London, Fraunhofer, TU Delft, Aalto University, University of Sheffield, Università di Tartu, Leibniz Universität Hannover. Oltre a collaborazioni internazionali con la Pennsylvania State University, la Northeastern University di Boston, il MIT di Cambridge (USA), la Central European University Budapest, la Dalhousie University di Halifax (CA).

Poiché il corso di dottorato in Data Science è in collaborazione con l'Università di Pisa, la Scuola Sant'Anna di Studi Avanzati - Pisa, la IMT Scuola di Studi Avanzati - Lucca, e il CNR, i corsi impartiti sono erogati da tutte le istituzioni partner.

Per l'elenco completo dei corsi offerti per l'anno accademico in corso da tutte le istituzioni partner, visitare il sito Web (https://datasciencephd.eu/). Qui si trovano anche le informazioni dettagliate sui contenuti e gli obiettivi del corso di dottorato.