MINISTERO DELL'ISTRUZIONE, DELL'UNIVERSITÀ E DELLA RICERCA


Modulo Proposta Anagrafe dei dottorati - a.a. 2018/2019
codice = DOT1743928




1. Informazioni generali



Corso di Dottorato

Il corso è: Rinnovo 
Denominazione del corso a.a. 2017/2018 DATA SCIENCE 
Cambio Titolatura? NO 
Ciclo 34 
Data presunta di inizio del corso 01/11/2018 
Durata prevista 3 ANNI 
Dipartimento/Struttura scientifica proponente Classe di scienze 
Dottorato in collaborazione con le imprese/dottorato industriale
(art. 11 del regolamento):
NO
[dato riportato in automatico dalla sezione "Tipo di Organizzazione"]
 
Dottorato in collaborazione con Università e/o enti di ricerca esteri
(art. 10 del regolamento):
NO
[dato riportato in automatico dalla sezione "Tipo di Organizzazione"]
 
Dottorato relativo alla partecipazione a bandi internazionali: NO 
se altra tipologia:
-
 
se SI, Descrizione tipo bando  
se SI, Esito valutazione  
Il corso fa parte di una Scuola? NO 
Presenza di eventuali curricula? NO 
Sito web dove sia visibile l'offerta formativa prevista ed erogata https://www.sns.it/phd/corsi-di-phd 


AMBITO: indicare i settori scientifico disciplinari coerenti con gli obiettivi formativi del corso

n. Settori scientifico disciplinari interessati (SSD) Indicare il peso percentuale di ciascun SSD nel progetto scientifico del corso Settori concorsuali interessati Macrosettore concorsuale interessato Aree CUN-VQR interessate
1. INF/01    %  25,00  INFORMATICA  01/B - INFORMATICA 
01 - Scienze matematiche e informatiche
 
2. ING-INF/05    %  22,00  SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI  09/H - INGEGNERIA INFORMATICA 
09 - Ingegneria industriale e dell'informazione
 
3. FIS/03    %  14,50  FISICA SPERIMENTALE DELLA MATERIA  02/B - FISICA DELLA MATERIA 
02 - Scienze fisiche
 
4. SECS-S/01    %  7,00  STATISTICA  13/D - STATISTICA E METODI MATEMATICI PER LE DECISIONI 
13 - Scienze economiche e statistiche
 
5. BIO/09    %  3,50  FISIOLOGIA  05/D - FISIOLOGIA 
05 - Scienze biologiche
 
6. CHIM/02    %  3,50  MODELLI E METODOLOGIE PER LE SCIENZE CHIMICHE  03/A - ANALITICO, CHIMICO-FISICO 
03 - Scienze chimiche
 
7. FIS/01    %  3,50  FISICA SPERIMENTALE DELLE INTERAZIONI FONDAMENTALI  02/A - FISICA DELLE INTERAZIONI FONDAMENTALI 
02 - Scienze fisiche
 
8. GEO/07    %  3,50  GEOCHIMICA, MINERALOGIA, PETROLOGIA, VULCANOLOGIA, GEORISORSE ED APPLICAZIONI  04/A - GEOSCIENZE 
04 - Scienze della Terra
 
9. MED/42    %  3,50  IGIENE GENERALE E APPLICATA, SCIENZE INFERMIERISTICHE E STATISTICA MEDICA  06/M - SANITA’ PUBBLICA 
06 - Scienze mediche
 
10. SECS-P/08    %  3,50  ECONOMIA E GESTIONE DELLE IMPRESE  13/B - ECONOMIA AZIENDALE 
13 - Scienze economiche e statistiche
 
11. SECS-S/06    %  3,50  METODI MATEMATICI DELL'ECONOMIA E DELLE SCIENZE ATTUARIALI E FINANZIARIE  13/D - STATISTICA E METODI MATEMATICI PER LE DECISIONI 
13 - Scienze economiche e statistiche
 
12. SPS/07    %  3,50  SOCIOLOGIA GENERALE  14/C - SOCIOLOGIA 
14 - Scienze politiche e sociali
 
13. SPS/08    %  3,50  SOCIOLOGIA DEI PROCESSI CULTURALI E COMUNICATIVI  14/C - SOCIOLOGIA 
14 - Scienze politiche e sociali
 
  TOTALE    %  100,00          


Descrizione e obiettivi del corso

Una conseguenza dirompente della rivoluzione digitale e della conseguente disponibilità dei “big data”, combinata con l’avanzamento delle tecniche di analisi di dati e delle infrastrutture di calcolo scalabili, è l’emergere della “Data Science”. E’ un cambio di paradigma che investe tutte le discipline, una nuova sintesi fra teorie, modelli e conoscenze che emergono dalle grandi masse di dati, in grado di spiegare più a fondo la complessità dei fenomeni sociali, economici, biologici, tecnologici, culturali, naturali. I dati hanno favorito la convergenza di discipline diverse per lo sviluppo di modelli ed algoritmi per l’estrazione di conoscenza dai dati: database e data mining, machine learning e intelligenza artificiale, sistemi complessi e network science, statistica e fisica statistica, matematica applicata.
In questo quadro, il dottorato si pone l’obiettivo di creare una nuova generazione di ricercatori che sappiano coniugare alle competenze disciplinari quelle di “data scientist”, in grado di sfruttare il patrimonio di dati e modelli per l’avanzamento delle conoscenze, sia nelle specifiche discipline che all’interfaccia fra discipline diverse. A tal fine, il dottorato fornisce un mix di competenze e conoscenze sui metodi per l’acquisizione, l’integrazione e la gestione dei big data, sulle tecniche di analisi e modellizzazione dei dati, sulle tecniche di visualizzazione e narrazione delle conoscenze, sugli aspetti etici e l’impatto sociale della Data Science.


Sbocchi occupazionali e professionali previsti

La figura del “data scientist”, nelle varie sfumature professionali, è una delle più ricercate nel mercato del lavoro a livello globale. Le fonti più autorevoli concordano nel prevedere una forte carenza di data scientist rispetto alla domanda, sia in ambito industriale/aziendale che in ambito accademico. Ad esempio il rapporto “The Future of Jobs - Employment, Skills and Workforce Strategy for the Fourth Industrial Revolution” del World Economic Forum (2016), basato su una indagine globale nei diversi settori produttivi, identifica nei “big data” e tecnologie associate il principale fattore dirompente di cambiamento, e nel “data scientist/data analyst” l’unica figura professionale che emerge come critica e indispensabile in tutti i settori produttivi e in tutti i luoghi. Citando dal rapporto, “companies expect data scientists help them make sense and derive insights from the torrent of data generated by the technological disruptions.” La competizione fra le aziende per assicurarsi talenti nell’ambito della data science sarà pertanto accesa, specialmente per figure ad elevata qualificazione, con uno spiccato orientamento verso l’innovazione e la ricerca. Si prevede quindi un’alta impiegabilità dei dottori di ricerca in Data Science, sia nella ricerca che nell’industria e nel settore pubblico.


Sede amministrativa

Ateneo Proponente: Scuola Normale Superiore di PISA 
N° di borse finanziate 2 


Tipo di organizzazione

2b) Convenzione
 
con
(indicare i soggetti partecipanti al consorzio/convenzione):
 

Università italiane

Università straniere

enti di ricerca pubblici o privati di alta qualificazione, anche di Paesi diversi

imprese che svolgono attività di ricerca e sviluppo
 
se in convenzione:   1) data di sottoscrizione: 12/05/2017  numero di cicli di dottorato:3 
(eventuale)      


Atenei italiani consorziati/convenzionati

Denominazione Dipartimento/ Struttura Consorziato/ Convenzionato Sede di attività formative N° di borse finanziate Rilascio del titolo congiunto/multiplo:
Università di PISA  INFORMATICA  Convenzionato  SI  2  SI 
Scuola Superiore di Studi Universitari e Perfezionamento Sant'Anna  Istituto di Economia  Convenzionato  SI  2  SI 
Scuola IMT - Istituzioni, Mercati, Tecnologie - Alti Studi - LUCCA  ECONOMICS AND INSTITUTIONAL CHANGE  Convenzionato  SI  1  SI 


Altri Enti consorziati/convenzionati

n. Denominazione del soggetto Tipologia del soggetto Pubblico/Privato Consorziato/ Convenzionato Paese Sede di attività formative N° di borse finanziate
1. CONSIGLIO NAZIONALE DELLE RICERCHE  ente di ricerca  PUBBLICO  Convenzionato  Italia  SI  2 


Note



2. Collegio dei docenti



Coordinatore

Cognome Nome Ateneo Proponente: Dipartimento/ Struttura Qualifica Settore concorsuale Area CUN-VQR
PEDRESCHI  Dino  PISA  INFORMATICA  Professore Ordinario  01/B1  01 



Curriculum del coordinatore


1. Curriculum del coordinatore

GENERALE: Dino Pedreschi è nato il 24 Ottobre 1958 a Castelnuovo Garfagnana, Lucca, Italia. Sposato, ha due figli.

TITOLI DI STUDIO:
- Laurea in Scienze dell'Informazione (1982, Univ. Pisa, 110 e lode);
- Dottorato di ricerca in Informatica (PhD in Computer Science, 1988, Univ. Pisa).

POSIZIONE ATTUALE:
- Professore Ordinario di Informatica (dal 2000, Univ. Pisa),
- Associato di ricerca all'Istituto di Scienza e Tecnologie dell'Informazione "A. Faedo" del CNR, ISTI-CNR
- Coordinatore del KDD Lab – Knowledge Discovery and Data Mining Laboratory, congiunto fra Univ. Pisa e ISTI-CNR http://kdd.isti.cnr.it, (dal 1995),
- Vice-coordinatore dell'infrastruttura europea di ricerca H2020 SoBigData - "Social Mining & Big Data Ecosystem" http://www.sobigdata.eu
- Direttore del Master di II livello in Big Data Analytics and Social Mining of University fo Pisa (dal 2014) http://masterbigdata.it/
- Coordinatore del Dottorato in Data Science di Scuola Normale Superiore, Univ. Pisa, CNR, Scuola Sup. S. Anna e Scuola IMT (dal 2017).

POSIZIONI RICOPERTE:
- Coordinatore della laurea magistrale in Data Science & Business Informatics (2008, Univ. Pisa)
- Prorettore per la didattica (2000-2002, Univ. Pisa)
- Presidente dei corsi di studio in Informatica (1997-2000, Univ. Pisa)
- Professore associato (1992/2000, Univ. Pisa)
- Ricercatore (1988/92, Univ. Pisa)
- Visiting professor presso Paris School of Economics, Univ. Paris 1-Sorbonne, Paris (October 2016), Central European University Budapest (October-December 2015), Barabási Lab, Center for Complex Network Research, Northeastern University, Boston, U.S.A. (2009-2010) (August 2016), Univ. of British Columbia at Vancouver, Canada (Summer 2006), UCLA, Univ. of California at Los Angeles, U.S.A.(1995), C.W.I. Amsterdam, The Netherlands (1993), University of Texas at Austin, U.S.A.(1989/90).

AWARDS:
- 1989-1990 NATO Fellowship;
- 2008-2009 Google Research Award, per il progetto “ANONIMO - An alliance of IT and law for the protection of privacy and anonymity of personal data.”
- 2017 Ordine del Cherubino – Università di Pisa.

DIDATTICA:
D.P. ha insegnato corsi di programming languages, artificial intelligence, databases, data mining, web mining and social network analysis in università italiane ed estere, sia a livello undergraduate che a livello di lauree magistrali e dottorato. Attualmente insegna i corsi di Data Mining e di Social Network Analysis alle lauree magistrali di Informatica e di Data Science & Business Informatics dell'Univ. Pisa, e il corso di Data Mining & Machine Learning al Master in Management dell'Innovazione della Scuola Superiore S. Anna in Pisa e al Master in Big Data & Social Mining dell'Univ. di Pisa, oltre a vari corsi di dottorato in Data Science, Big Data Analytics, Social Network Analysis and Privacy Preserving Data Mining in varie università. D.P. è il direttore del Master in Big Data Analytics & Social Mining dell'University of Pisa http://masterbigdata.eu e coordinatore del dottorato in Data Science della Scuola Normale Superiore di Pisa, congiunto con Università di Pisa, CNR, Scuola S. Anna e Scuola IMT Lucca http://datasciencephd.eu.

SUPERVISIONE:
D.P. è stato relatore di oltre 100 tesi di laurea e il supervisore di 20 dottorandi di ricerca e 15 post-doc. Nove dottorandi fra quelli di cui è stato supervisore hanno conseguito posizioni di ricerca in istituzioni italiane ed estere.

RESPONSABILITA' ISTITUZIONALI:
D.P. è stato presidente dei corsi di studio in Informatica all'Univ. di Pisa (1997-2000), e prorettore alla didattica nella stessa università (2000-2002), con la delega all'implementazione della struttura a due livelli dell'istruzione universitaria (3+2) in accordo al Bologna Process. Ha progettato e lanciato con successo alcuni esempi pionieristici di corsi di studio interdisciplinari, come Informatica Umanistica (Digital Humanities) e Data Science & Business Informatics. D.P. è stato uno dei dieci Italian Bologna Promoters in 2004-2005. E' membro, dal 2013, della Commissione Big Data di ISTAT, l'Istituto Statistico italiano.

ORGANIZZAZIONE DI CONFERENZE:
D.P. è un membro stabile dei senior program committees delle principali conferenze internazionali di data mining e knowledge discovery (dal 2003): ACM SIGKDD, SIAM SDM, IEEE ICDM, ECML/PKDD. E' stato program chair di ECML/PKDD 2004, European conference on Machine Learning and Knowledge Discovery in Databases, e membro dello steering committee fino al 2008; vice-chair di ICDM 2005 e ICDM 2008, IEEE Int. Conf. on Data Mining, ICDE 2014 - IEEE Int. Conf. on Data Engineering e ICDM 2017. E' stato program co-chair di NetSciX 2016, International School and Conference on Network Science, ed è program co-chair di SDM 2018, SIAM Conference on Data Mining.

TEMI DI RICERCA:
D.P. è autore di più di 270 publications sui temi seguenti: Big Data Analytics & Social Mining: Analysis of human mobility, Social Network Analysis and Mining, Privacy-by-design and ethical data mining, Nowcasting of socio-economic indicators, Complex Network Dynamics, Sport Data Analytics. Data Mining and Knowledge Discovery in Databases: Privacy-preserving Data Mining, Spatio-temporal Data Mining, Constraint-based Pattern Discovery, Data Mining Query Languages, Mobility data mining, Market Basket Analysis, Fraud Detection. Databases and Knowledge-bases: Logic in Databases, Expressiveness Analysis of Logic Query Languages, Non monotonic Non Deterministic Reasoning, Deductive and Object-oriented Databases. Formal Methods: Partial (symbolic) Evaluation in Functional Programming, Termination of Logic Programs, Verification of Logic Programs, Type Systems in Functional Languages and Databases. Logic Programming: Foundations, Semantics of negation, Integration with functional programming, Modular programming

PUBBLICAZIONI:
Google Scholar, consultato il 28 Febbraio 2018, riporta oltre 300 pubblicazioni che hanno ricevuto oltre 8000 citazioni. L'h-index è 42 e l'i10-index (numero di lavori con 10 o più citazioni) è 119. Il server Computer Science Bibliography dblp.uni-trier.de riporta 215 lavori a partire del 1985. D.P. è classificato fra i 100 studiosi più influenti nel Data Mining nel ranking 2016 di “AMiner Most Influential Scholar Annual List” che elenca i ricercatori più citati al mondo. D.P. è co-editor con Fosca Giannotti del libro “Mobility, Data Mining and Privacy”, Springer, 2008, che ha aperto la strada nella nuova area interdisciplinare del privacy-aware spatio-temporal data mining su dati di mobilità.

LEADERSHIP SCIENTIFICA:
Nel 1995 D.P. è stato co-fondatore, con Franco Turini e Fosca Giannotti, del Pisa Knowledge Discovery and Delivery Laboratory – KDD LAB http://kdd.isti.cnr.it/ – una iniziativa congiunta di due istituzioni (CNR and Univ. Pisa) focalizzata sulla ricerca in Data Mining and Knowledge Discovery in Databases. KDD LAB è il primo laboratorio di data mining in Italia ed uno dei primi in Europa. Nel 2000 D.P. da inizio ad una nuova direzione di ricerca interdisciplinare, all'incrocio fra data mining, mobilità umana e privacy, ovvero privacy-aware spatio-temporal data mining da dati di mobilità, raccolti da dispositivi di geolocalizzazione. La ricerca fu inizialmente supportata dal progetto MIUR/PRIN GeoPKDD.it (2004-2007)– Geographic Privacy-aware Knowledge Discovery and Delivery coordinato da D. P., e più tardi dal progetto Europeao FP6 GeoPKDD (2005-2009) co-coordinato da D.P.. Uno dei lavori seminali di questa linea, “Trajectory pattern mining”, presentato al convegno SIGKDD 2007, ha ricevuto oltre 800 citazioni ad ora. Nel 2007-2008, D.P. è l'iniziatore del discrimination-aware data mining, una linea di ricerca orientata all'analisi dei rischi di decisioni discriminatorie sulla base di regole apprese dai dati, di nuovo con un lavoro pionieristico presentato alla principale conferenza del settore SIGKDD 2008, intitolato “Discrimination-aware data mining”, e ritenuto oggi il lavoro iniziale di un'area che oggi annovera una comunità scientifica sempre più vasta. Nel 2009-2010 visita il Center for Complex Network Research at Northeastern University in Boston e, in collaborazione con il fisico statistico A. L. Barabasi, D.P. getta le basi per la confluenza fra i metodi della fisica statistica e dei sistemi complessi da un lato, con i metodi del data mining e del machine learning dall'altro, con la finalità di comprendere e prevedere i fenomeni della complessità socio-economica, come la diffusione delle epidemie, i pattern di mobilità umana, i comportamenti sociali. Nel settembre 2015 un lavoro congiunto con Barabasi sulla scoperta data-driven di due profili ben separati di mobilità umana, denominati explorers e commuters, è stato pubblicato su Nature Communications. Attualmente, D.P. è uno degli scienziati internazionali di punta impegnati da un lato a dare forma alle sfide della Data Science, là dove il data mining incontra la scienza delle reti e i modelli quantitativi delle scienze socio-economiche, e dall'altro lato a disegnare e realizzare iniziative rivolte a formare la prossima generazione di data scientist multi-disciplinari.

KEYNOTE & SEMINARI:
D.P. ha dato negli ultimi 5 anni un totale 28 keynotes e invited seminar su Big Data and Social Mining, incluso un intervento in plenaria presso le Nazioni Unite a Ginevra il 16 Giugno 2015 sul tema “Big Data Analytics and Social Mining for Science and Society” e la relazione invitata “Data science for smart cities and smarter citizens” al “Data-driven life” EDPS workshop (European Data Protection Supervisor). European Parliament Brussels, May 2017.

PROGETTI ITALIANI PRIN-MIUR:
D.P. è stato coordinatore nazionale del progetto PRIN “GeoPKDD.it” (2002-2005) e co-cordinatore del progetto PRIN “Anonimo – Anonimato e Privacy nell’Analisi di Dati. (2008-2010)”

PROGETTI EUROPEI:
D.P. è stato PI di vari progetti finanziati dalla Commissione Europea presso Univ. Pisa sin dal 1993, quando è stato coordinatore del progetto EC-US Non-determinism in deductive databases. D.P. è stato coordinatore del working group su Security and Privacy del progetto FP6 FET-Open CA KDubiq, Ubiquitous Knowledge Discovery http://www.kdubiq.org. Insieme a Fosca Giannotti del KDD LAB, a partire dal 2004, ha coordinato una serie di progetti FET-Open che hanno iniziato l'area del mobility data mining, privacy-preserving data mining e privacy-by-design. Il progetto FP6 GeoPKDD (2005-2009, www.geopkdd.eu) ha costruito la prima piattaforma di big data analytics privacy-aware per il mining di dati di mobilità (mobile phone data and GPS devices). D.P. è stato il coordinatore scientifico dell'attività Privacy-aware spatio-temporal data mining. Il sistema GeoPKDD per l'analisi e la visualizzazione dei pattern di mobilità è stato selezionato per essere presentato al Parlamento Europeo di Strasburgo nell'Aprile 2010. I progetti europei più recenti sono elencati sotto.

PROGETTI EUROPEI RECENTI:
D.P. è stato coordinatore per il KDD Lab di molti progetti finanziati dalla UE all'interno del FET-Open program, nella scia della linea aperta con GeoPKDD:
- MODAP: Mobility, Data Mining, and Privacy (2009-2012) FET Open Coordination Action
- LIFT – Using Local Inference in Massively Distributed Systems (2009-2013, http://lift-eu.org/), where privacy-by-design is adopted in highly distributed techno-social systems for the analysis of collective behavior.
- DATASIM – A Data Science for Simulating the Era of Electric Vehicles (2011-2014, http://www.datasim-fp7.eu) where mobility data mining, network science and agent-based simulation are merged to achieve realistic forecasts of the impact of a massive switch to electric cars. Research here has produced the paper “Returners and Explorers” on Nature Communication.
- ICON – Inductive Constraint Programming (2012-2014, http://www.icon-fet.eu/), where mobility DM, network science and constraint programming merge and demonstrated in a carpooling scenario.
- PETRA - Personal Transport Advisor: an integrated platform of mobility patterns for Smart Cities to enable demand-adaptive transportation systems (2013-2016, http://www.petraproject.eu/)
- CIMPLEX – Bringing CItizens, Models and Data together in Participatory, Interactive SociaL EXploratories (2014-2017, H2020 FET Proactive https://www.cimplex-project.eu/)
- SOBIGDATA.eu – (2015-2019, H2020 Research Infrastructure on Social Mining and Big Data Analytics http://www.sobigdata.eu)

D.P. ha coordinato molti progetti collaborativi di R&D industriale con aziende come Toyota, KDDI Japan, SAS, WIND, VODAFONE, ENEL, ORANGE, TELECOM ITALIA, COOP, OCTO, Siemens.

COLLABORAZIONI:
D.P. ha molte collaborazioni durature con scienziati internazionali di discipline diverse: studiosi legali attivi in ambito privacy e diritti umani (Mireille Hildebrandt), computational social scientists (Dirk Helbing e Sandy Pentland), filosofi morali esperti di etica delle tecnologie digitali (Jeroen van der Hoven), fisici dei sistemi complessi (Albert-László Barabási, Janos Kertesz), esperti di visualizzazione dati (Gennady and Natalia Andrienko), intelligenza artificiale (Paul Lukowicz) e molti colleghi della comunità data mining e machine learning.

10-YEAR TRACK-RECORD

Top-10 pubblicazioni selezionate

1. F. Giannotti, M. Nanni, F. Pinelli, D. Pedreschi: Trajectory pattern mining. 13th ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining KDD 2007: 330-339 (868 citations)
2. Dashun Wang, Dino Pedreschi, Chaoming Song, Fosca Giannotti, Albert-László Barabási: Human mobility, social ties, and link prediction. 17th ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining KDD 2011: 1100-1108 (419 citations)
3. Fosca Giannotti, Mirco Nanni, Dino Pedreschi, Fabio Pinelli, Chiara Renso, Salvatore Rinzivillo, Roberto Trasarti: Unveiling the complexity of human mobility by querying and mining massive trajectory data. The VLDB Journal 20(5): 695-719 (2011) (200 citations)
4. D. Pedreschi, S. Ruggieri, F. Turini: Discrimination-aware data mining.14th ACM SIGKDD 2008: 560-568 (193 citations)
5. D. Pedreschi, S. Ruggieri, F. Turini: Measuring Discrimination in Socially-Sensitive Decision Records. Proc. SIAM International Conference on Data Mining, SDM 2009, p. 582-591(103 citations)
6. Salvatore Ruggieri, Dino Pedreschi, Franco Turini: Data mining for discrimination discovery. ACM Transaction on Knowledge Discovery 4(2): (2010) (102 citations)
7. F Giannotti, LVS Lakshmanan, A Monreale, D Pedreschi, H Wang. Privacy-preserving mining of association rules from outsourced transaction databases. IEEE Systems Journal, 7 (3), 385-395 (2013) (with 75 citations)
8. M Berlingerio, M Coscia, F Giannotti, A Monreale, D Pedreschi. Multidimensional networks: foundations of structural analysis. World Wide Web 16 (5-6), 567-593 (2013) (74 citations)
9. L. Pappalardo, F. Simini, S. Rinzivillo, D. Pedreschi, F. Giannotti, D. Pedreschi, A-L. Barabasi. Returners and Explorers Dichotomy in Human Mobility. Nature Communications 6, 2015 (40 citations)
10. Sara Hajian, Josep Domingo-Ferrer, Anna Monreale, Dino Pedreschi, Fosca Giannotti. Discrimination- and privacy-aware patterns. Data Min. Knowl. Discov. 29(6): 1733-1782 (2015) (15 citations)

Publications of monographs and editors of conference proceedings
(F. Giannotti, D. Pedreschi, Eds.) Mobility, Data Mining and Privacy. Springer, ISBN 978-3-540-75176-2, 2008, (276 citations)

KEYNOTES & SEMINARS:
D.P. ha tenuto oltre 50 keynote talks e Phd school courses su Big Data and Social Mining; alcuni dei più recenti sono i seguenti.

PhD courses in international advanced schools:
- “Nowcasting well-being in societies: at the crossroads of big data, network science, and complex systems”, Paris School of Economics, Univ. Paris 1-Sorbonne, France (October 2016)
- “Nowcasting well-being in societies: at the crossroads of big data, network science, and complex systems”. Course at Lipari Summer School on Computational Social Sciences, July 2016.
- “Social Network Analysis”. Doctorat de Ciències Polítiques i Socials. Universitat Pompeu Fabra, Barcelona (May 2016)
- “Social Network Analysis”. Computer Science Dept. University of Bari (May 2015),
- “Big Data Analytics”. Central European University Budapest (November-December 2015)
- “Social Network Analysis”. Estonian Computer Science Summer School (August 2014),
- “Big Data Analytics, Mobility & Privacy”. Big Data Institute Dalhousie University Halifax (Oct. 2013),
- “Privacy Preserving Data Mining” Galileo PhD School Univ. Pisa (2012-14),
- “Big Data Analytics and Social Mining” UFC Fortaleza, Brazil January 2013),
- “Big Data Analytics and Social Mining” PUC University Rio de Janeiro, Brazil (January 2013).

Recent keynotes & invited talks.
- “Data science for smart cities and smarter citizens”. Invited lecture at “Data-driven life” EDPS workshop (European Data Protection Supervisor). European Parliament Brussels, May 2017
- “The networks of human mobility”. Keynote at NETMOB 2017, Int. Conf. on Networks and Mobility, Milano, April 2017
- “Exploring human mobility and migration with BigData”. Invited lecture at NTTS 2017, Eurostat Conference on New Techniques and Technologies for Statistics, Brussels, March 2017
- “Big Data & Industria 4.0”. Invited lecture at Industria 4.0 Workshop, Unione Industriale Pisana, March 2017
- “Data ethics and machine learning. Discrimination, algorithmic bias, and how to discover them.” Keynote at Data Driven Innovation 2017, Rome, February 2017
- “Big Data, Diversity & Well-being”. Invited lecture at BIG DATA AND MIGRATION workshop, Paris School of Economics & CEPII, Paris, October 2016
- “Nowcasting well-being in societies: at the crossroads of data science and complex systems”. Invited seminar at Paris School of Economics, October 2016
- “Social mining & big data”. Invited lecture at OPA Europe workshop, Online Publishers Association, Pisa, October 2016
- “Measuring, understanding, nowcasting well-being”. Invited lecture at FBK-MIT Workshop, Trento, September 2016
- “Measuring well-being”. Invited lecture at So Good Workshop, ECML PKDD 2016, European Machine Learning & Knowledge Discovery Conf., September 2016
- “Nowcasting well-being with big data”. Invited seminar at First SoBigData workshop, Hannover, September 2016.
- Invited panelist at EISRI 2016, European Intersectoral Summit on Research and Innovation: Science, Media and Public Discourse: linking citizen engagement and evidence based policymaking. European Parliament, Brussels, April 2016
- “Big Data Analytics & Social Mining”. Invited seminar at CEU, Central European University, Budapest, Dec. 2015.
- “Towards a Digital Time machine fueled by Big Data and Social Mining” September 2015. Keynote at the European Conference on Machine Learning & Knowledge Discovery, Porto, Portugal
- “Big Data Analytics and Social Mining and Privacy”, December 2015, Institute for Advanced Studies, Central European University Budapest
- “Big Data Analytics and Social Mining for Science and Society” United Nations, Genève, 16 June 2015. 63rd UNECE Conference of Official Statistics Institutes
- “Privacy and Big Data" BOZAR, Brussels Museum of Fine Arts, 4 March 2015. Interviewed by Luca De Biase, an event dedicated to “Italians shaping the future”, Italian Institute of Culture in Brussels.
- “Big Data Analytics and Complexity” Rome, Forum PA, June 2015. Invited talk within the workshop on “Data-driven decisions”.
- “Data for Development” Milan, SAS Forum 2014, 22 April 2014. Keynote on in plenary session, 2000+ attendees.
- “New deal on data”, Taiwan-Italy Workshop, 27 February 2014 (Rome).
- “Towards a Digital Time machine fueled by Big Data and Social Mining” Pisa, December 2014. Keynote at AI*IA 2014, Italian Conf. on Artificial Intelligence.
- “Big Data and Social Mining” Rome, Forum PA, June 2014. Invited talk within the workshop “Big Data / Open Data”,
- TED Keynote on “The Importance of Social Diversity”. TEDx Roncade (Treviso), 21 February 2014.
- “Big Data, Social Mining and Privacy” October 16, 2013. Invited talk at Big Data Institute, Dalhousie University, Halifax, Canada.
- “Big Data, Social Mining and Privacy” Garante per la Protezione dei Dati Personali, (Rome) 30 Maggio 2013, “Big Data, Social Mining and Privacy”
- “The Future of Big Data Big Data & Social Mining for Science and Policy" invited by the European Commision - Digital Agenda for Europe - on their Futurium Platform, 10 May 2013.

Contributi alla carriera di giovani ricercatori
D.P. è stato supervisore di 20 PhD students e 15 PostDocs all'Univ. di Pisa - KDD Lab. Nove dei suoi studenti di dottorato hanno conseguito posizioni di ricerca prestigiose presso istituzioni italiane ed estere: Salvatore Ruggieri (PO, Univ. Pisa), Giuseppe Manco (R, ICAR-CNR), Mirco Nanni (R, ISTI-CNR), Roberto Trasarti (R, ISTI-CNR), Maurizio Atzori (R, Univ. Cagliari), Francesco Bonchi (senior researcher, ISI,Torino), Michele Berlingerio (senior researcher, IBM Research Dublin), Michele Coscia (R, Harvard Kennedy School in Cambridge, MA, U.S.A.), Anna Monreale (R, Univ. Pisa).


2. Esperienza di coordinamento centrale o di unità di gruppi di ricerca e/o di progetti nazionali o internazionali competitivi negli ultimi 10 anni


Progetto di ricerca nazionale (es. PRIN, FIRB, Fondazioni ecc.)
 
se valorizzato:    

Progetto di ricerca internazionale (es. FP7, ERC, NIH, ecc.)
 
se valorizzato:   Coordinatore nazionale 

3. Partecipazione a comitati di direzione o di redazione di riviste A/ISI/Scopus

3a. Direzione di riviste, collane editoriali, enciclopedie nell'ultimo decennio

Responsabilità Titolo editoriale Anno inizio Anno fine


3b. Partecipazione a comitati di redazione

n. Responsabilità Titolo editoriale Anno inizio Anno fine
1. MEMBRO DEL COMITATO EDITORIALE  KNOWLEDGE AND INFORMATION SYSTEMS (ISSN: 0219-1377 [Print] / 0219-3116 [Online])  2007  2014 
2. MEMBRO DEL COMITATO EDITORIALE  STATISTICAL ANALYSIS AND DATA MINING (ISSN:1932-1872)  2011   



Membri del collegio (Personale Docente e Ricercatori delle Università Italiane)

n. Cognome Nome Ateneo Dipartimento/ Struttura Ruolo Qualifica Settore concorsuale Area CUN-VQR SSD Stato conferma adesione
1. PEDRESCHI   Dino   PISA  INFORMATICA  Coordinatore  Professore Ordinario  01/B1   01   INF/01   ha aderito 
2. CELLERINO   Alessandro   Scuola Normale Superiore di PISA  Classe di scienze  Altro Componente  Professore Associato (L. 240/10)  05/D1   05   BIO/09   ha aderito 
3. PAVAN   Elena   Scuola Normale Superiore di PISA  Dipartimento di Scienze politico-sociali  Componente del gruppo dei 16  Ricercatore a t.d. - t.pieno (art. 24 c.3-a L. 240/10)  14/C1   14   SPS/07   ha aderito 
4. RUGGIERI   Salvatore   PISA  INFORMATICA  Componente del gruppo dei 16  Professore Ordinario (L. 240/10)  01/B1   01   INF/01   ha aderito 
5. LOPALCO   Pietro Luigi   PISA  RICERCA TRASLAZIONALE E DELLE NUOVE TECNOLOGIA IN MEDICINA E CHIRURGIA  Componente del gruppo dei 16  Professore Ordinario (L. 240/10)  06/M1   06   MED/42   ha aderito 
6. BRACCIALE   Roberta   PISA  SCIENZE POLITICHE  Altro Componente  Ricercatore confermato  14/C2   14   SPS/08   ha aderito 
7. MARCELLONI   Francesco   PISA  INGEGNERIA DELL'INFORMAZIONE  Componente del gruppo dei 16  Professore Ordinario (L. 240/10)  09/H1   09   ING-INF/05   ha aderito 
8. PISANTI   Nadia   PISA  INFORMATICA  Altro Componente  Professore Associato (L. 240/10)  01/B1   01   INF/01   ha aderito 
9. PRATESI   Monica   PISA  ECONOMIA E MANAGEMENT  Componente del gruppo dei 16  Professore Ordinario  13/D1   13   SECS-S/01   ha aderito 
10. RODA   Chiara Maria Angela   PISA  FISICA  Componente del gruppo dei 16  Professore Associato (L. 240/10)  02/A1   02   FIS/01   ha aderito 
11. CUCINOTTA   Tommaso   Scuola Superiore Sant'Anna  Istituto di Tecnologie della Comunicazione, dell'lnformazione e della Percezione (TECIP)  Componente del gruppo dei 16  Professore Associato (L. 240/10)  09/H1   09   ING-INF/05   ha aderito 
12. PICCALUGA   Andrea Mario Cuore   Scuola Superiore Sant'Anna  Istituto di Management  Componente del gruppo dei 16  Professore Ordinario  13/B2   13   SECS-P/08   ha aderito 
13. CHIAROMONTE   Francesca   Scuola Superiore Sant'Anna  Istituto di Economia  Altro Componente  Professore Ordinario  13/D1   13   SECS-S/01   ha aderito 
14. CIMINI   Giulio   Scuola IMT - LUCCA  ECONOMICS AND INSTITUTIONAL CHANGE  Altro Componente  Ricercatore a t.d. - t.pieno (art. 24 c.3-a L. 240/10)  02/B2   02   FIS/03   ha aderito 
15. SQUARTINI   Tiziano   Scuola IMT - LUCCA  ECONOMICS AND INSTITUTIONAL CHANGE  Componente del gruppo dei 16  Ricercatore a t.d. - t.pieno (art. 24 c.3-a L. 240/10)  02/B2   02   FIS/03   ha aderito 
16. LILLO   Fabrizio   BOLOGNA  Matematica  Componente del gruppo dei 16  Professore Ordinario (L. 240/10)  13/D4   13   SECS-S/06   ha aderito 
17. GADDUCCI   Fabio   PISA  INFORMATICA  Altro Componente  Professore Associato confermato  01/B1   01   INF/01   ha aderito 
18. MONREALE   Anna   PISA  INFORMATICA  Altro Componente  Ricercatore a t.d. (art. 24 c.3-b L. 240/10)  01/B1   01   INF/01   ha aderito 
19. KOCH   Henrik   Scuola Normale Superiore di PISA  Classe di scienze  Componente del gruppo dei 16  Professore Ordinario  03/A2   03   CHIM/02   ha aderito 
20. RAMPINO   Sergio   Scuola Normale Superiore di PISA  Classe di scienze  Altro Componente  Ricercatore a t.d. - t.pieno (art. 24 c.3-a L. 240/10)  03/A2   03   CHIM/02   ha aderito 
21. GARLASCHELLI   Diego   Scuola IMT - LUCCA  ECONOMICS AND INSTITUTIONAL CHANGE  Altro Componente  Professore Associato (L. 240/10)  02/B2   02   FIS/03   ha aderito 
22. ARMIENTI   Pietro   PISA  SCIENZE DELLA TERRA  Componente del gruppo dei 16  Professore Ordinario  04/A1   04   GEO/07   ha aderito 


Membri del collegio (Personale non accademico dipendente di altri Enti e Personale docente di Università Straniere)

n. Cognome Nome Ruolo Tipo di ente: Ateneo/Ente di appartenenza Paese Dipartimento/ Struttura Qualifica Codice fiscale SSD Attribuito Area CUN-VQR attribuita N. di Pubblicazioni (*)
1. BARABASI  ALBERT-LASZLO  Altro Componente  Università straniera  NORTHEASTERN UNIVERSITY, BOSTON  Stati Uniti d'America  Center for Complex Network Research  Professore di Univ.Straniera    FIS/03  02  58 
2. CONTI  MARCO  Comp. gruppo dei 16  Ente di ricerca (VQR)  Consiglio Nazionale delle Ricerche  Italia  IIT-CNR Istituto di Informatica e Telematica  Dirigenti di ricerca  CNTMRC62T16I622B  ING-INF/05  09  80 
3. DE PIETRO  GIUSEPPE  Altro Componente  Ente di ricerca (VQR)  Consiglio Nazionale delle Ricerche  Italia  ICAR-CNR Istituto di Calcolo e Reti ad Alte Prestazioni  Primi ricercatori  DPTGPP62B14F839F  ING-INF/05  09  90 
4. GIANNOTTI  FOSCA  Comp. gruppo dei 16  Ente di ricerca (VQR)  Consiglio Nazionale delle Ricerche  Italia  ISTI-CNR Istituto di Scienza e Tecnologie dell'Informazione  Dirigenti di ricerca  GNNFSC58R44C303V  INF/01  01  50 
5. KERTESZ  JANOS  Altro Componente  Università straniera  CEU - CENTRAL EUROPEAN UNIVERSITY, BUDAPEST  Ungheria  Center for Network Science  Professore di Univ.Straniera    FIS/03  02  30 
6. MATWIN  STAN  Altro Componente  Università straniera  DALHOUSIE UNIVERSITY, HALIFAX  Canada  Institute for Big Data Analytics  Professore di Univ.Straniera    INF/01  01  78 
7. PENTLAND  ALEX 'SANDY'  Altro Componente  Università straniera  MIT - MASSACHUSETTS INSTITUTE OF TECHNOLOGY  Stati Uniti d'America  Media Lab  Professore di Univ.Straniera    ING-INF/05  09  77 
8. PEREGO  RAFFAELE  Comp. gruppo dei 16  Ente di ricerca (VQR)  Consiglio Nazionale delle Ricerche  Italia  ISTI-CNR Istituto di Scienza e Tecnologie dell'Informazione  Primi ricercatori  PRGRFL62A28A757Y  ING-INF/05  09  51 


(*) se è di un settore bibliometrico, inserire il numero di prodotti pubblicati negli ultimi cinque anni (dal 2013 ad ora) su riviste scientifiche contenute nelle banche dati internazionali “Scopus” e “Web of Science”
(*) se è di un settore non bibliometrico, inserire il numero di prodotti pubblicati negli ultimi dieci anni (dal 2008 ad ora) in riviste di classe A




Principali Atenei e centri di ricerca internazionali con i quali il collegio mantiene collaborazioni di ricerca (max 5) con esclusione di quelli di cui alla sezione 1

n. Denominazione Paese Tipologia di collaborazione
1. UNIVERSITY OF SHEFFIELD  Regno Unito  (max 500 caratteri)
Istituzione partner dell'infrastruttura di ricerca europea SoBigData.eu http://www.sobigdata.eu​ che prevede un programma di visite di ricerca per dottorandi e post-doc nei diversi centri della rete, supportato attraverso una call periodica di "Transnational access" all'infrastruttura.
 
2. EIDGENOESSISCHE TECHNISCHE HOCHSCHULE - ETH ZUERICH  Svizzera  (max 500 caratteri)
Istituzione partner dell'infrastruttura di ricerca europea SoBigData.eu http://www.sobigdata.eu​ che prevede un programma di visite di ricerca per dottorandi e post-doc nei diversi centri della rete, supportato attraverso una call periodica di "Transnational access" all'infrastruttura.
 
3. TECHNISCHE UNIVERSITEIT - TU DELFT  Paesi Bassi  (max 500 caratteri)
Istituzione partner dell'infrastruttura di ricerca europea SoBigData.eu http://www.sobigdata.eu​ che prevede un programma di visite di ricerca per dottorandi e post-doc nei diversi centri della rete, supportato attraverso una call periodica di "Transnational access" all'infrastruttura.
 
4. FRAUNHOFER  Germania  (max 500 caratteri)
Istituzione partner dell'infrastruttura di ricerca europea SoBigData.eu http://www.sobigdata.eu​ che prevede un programma di visite di ricerca per dottorandi e post-doc nei diversi centri della rete, supportato attraverso una call periodica di "Transnational access" all'infrastruttura.
 
5. NORTHEASTERN UNIVERSITY, BOSTON, MA  Stati Uniti d'America  (max 500 caratteri)
Partnership scientifica consolidata fra SoBigData.eu ed il Center for Complex Networks Research, il cui direttore Prof. Albert-Laszlo Barabasi partecipa al collegio del dottorato.
 


Descrizione della situazione occupazionale dei dottori di ricerca che hanno acquisito il titolo negli ultimi tre anni

(max 1.500 caratteri)
Il corso in "Data Science" è stato istituito a partire dal 33° ciclo - nessun allievo pertanto ha finora conseguito il titolo


Note


3. Eventuali curricula
Curriculum dottorali afferenti al Corso di dottorato
La sezione è compilabile solo se nel punto "Corso di Dottorato" si è risposto in maniera affermativa alla domanda "Presenza di eventuali curricula?"


Note


4. Struttura formativa

Attività didattica disciplinare e interdisciplinare

Insegnamenti ad hoc previsti nell'iter formativo Tot CFU: 0  n.ro insegnamenti: 44  di cui è prevista verifica finale: 35 
Insegnamenti mutuati da corsi di laurea magistrale SI  n.ro: 12  di cui è prevista verifica finale: 12 
Insegnamenti mutuati da corsi di laurea (primo livello) NO     
Cicli seminariali SI 
Soggiorni di ricerca SI  ITALIA- al di fuori delle istituzioni coinvolte
ESTERO nell’ambito delle istituzioni coinvolte
ESTERO - al di fuori delle istituzioni coinvolte
 
Periodo medio previsto (in mesi per studente): 4 


Descrizione delle attività di formazione di cui all’art. 4, comma 1, lett. f)

Tipologia  Descrizione sintetica (max 500 caratteri per ogni descrizione)
Linguistica Sono disponibili corsi di lingua italiana per stranieri, inglese, francese, tedesco e cinese 
Informatica I dottorandi potranno partecipare alle attività formative trasversali, anche on-line, comuni a tutti i corsi di PhD attivati dalla SNS, di approfondimento della utilizzazione dei principali sistemi informatici, anche di carattere specialistico nonché, se necessario, ai corsi di allineamento sulle competenze di base in programmazione e gestione basi di dati attivate presso UNIPI. 
Gestione della ricerca, della conoscenza dei sistemi di ricerca e dei sistemi di finanziamento I dottorandi potranno partecipare alle attività formative trasversali, comuni a tutti i corsi di PhD attivati dalla SNS, per l'approfondimento delle modalità di gestione di una ricerca, oltre che dei principali sistemi di ricerca nazionali e internazionali, anche in relazione alle modalità di reperimento dei finanziamenti per la ricerca. 
Valorizzazione dei risultati della ricerca e della proprietà intellettuale I dottorandi potranno partecipare al PhD+, il programma dell’Università di Pisa per promuovere lo spirito imprenditoriale e di innovazione tra dottorandi, dottori di ricerca e docenti. Consiste in una serie di seminari coinvolgenti e di attività di coaching e mentoring su progetti imprenditoriali guidate da esperti internazionali. Il PhD+ rappresenta una best practice di formazione alla Valorizzazione della Ricerca, Innovazione e Auto-imprenditorialità. https://www.unipi.it/index.php/phd-plus 


Note


5. Posti, borse e budget per la ricerca

Posti, borse e budget per la ricerca

Descrizione Ciclo 34° Anagrafe dottorandi (33°) Ciclo 33°
A - Posti banditi
(messi a concorso)
 
1. Posti banditi con borsa   N. 8  7  7  
2. Posti coperti da assegni di ricerca     0   
3. Posti coperti da contratti di apprendistato     0   
Sub totale posti finanziati (A1+A2+A3)   N. 8  N. 7  N. 7 
4. Eventuali posti senza borsa     0   
B - Posti con borsa riservati a laureati in università estere   N. 1  1  1  
C - Posti riservati a borsisti di Stati esteri     0   
D - Posti riservati a borsisti in specifici programmi di mobilità internazionale     0   
E - Posti riservati a dipendenti di imprese impegnati in attività di elevata qualificazione (dottorato industriale) o a dipendenti di istituti e centri di ricerca pubblici impegnati in attività di elevata qualificazione (con mantenimento di stipendio)     0   
F - Posti senza borsa riservati a laureati in Università estere     0   
TOTALE = A + B + C + D + E + F   N. 9  N. 8  N. 8 
DI CUI CON BORSA = TOTALE – A4 - F   N. 9  N. 8  N. 8 
Importo della borsa
(importo annuale al lordo degli oneri previdenziali a carico del percipiente)
 
Euro: 17.000,00     
Budget pro-capite annuo per attività di ricerca in Italia e all’Estero
(a partire dal secondo anno, in termini % rispetto al valore annuale della borsa al lordo degli oneri previdenziali a carico del percipiente)
 
(min 10% importo borsa): 10,00     
Importo aggiuntivo alla borsa per mese di soggiorno di ricerca all’estero
(in termini % rispetto al valore mensile della borsa al lordo degli oneri previdenziali a carico del percipiente)
 
(MAX 50% importo borsa): 50,00     
BUDGET complessivamente a disposizione del corso per soggiorni di ricerca all'estero
(importo lordo annuale comprensivo degli oneri previdenziali a carico del percipiente)
 
Euro: 18.000,00     
 


Fonti di copertura del budget del corso di dottorato (incluse le borse)

FONTE  Importo (facoltativo) Descrizione Tipologia
(max 200 caratteri)
Fondi Ministeriali   FFO, Fondi MIUR per dottorato 
Progetti competitivi o fondi messi a disposizione dal proponente    
Fondi di ateneo    
Finanziamenti esterni   n. 2 borse finanziate dall'Università di Pisa, n. 2 borse finanziate dalla Scuola Superiore S. Anna, n. 1 borsa finanziata dalla Scuola IMT Alti Studi Lucca, n. 2 borse finanziate dal CNR 
Altro    


Note


6. Strutture operative e scientifiche

Strutture operative e scientifiche

Tipologia Descrizione sintetica (max 500 caratteri per ogni descrizione)
Attrezzature e/o Laboratori   SNS: Data center dedicato alla ricerca; UNIPISA: IT Center, centro interdip. di R&S c/o Dip. di Informatica; S_ANNA: Lab. di Telecomunicazioni, Informatica e Robotica Percettiva c/o Istituto di Tecnologie della Comunicazione, Informazione e Percezione, lab. dell’Istituto di Economia e dell’Istituto di Management, labb. di Neuroscienze e Bioingegneria c/o Istituto di BioRobotic; CNR: labb. gruppi KDD Lab. HPC Lab. e NEMIS Lab. di ISTI-CNR e gruppi WAFI Lab. ed Ubiquitos Internet Lab. di IIT-CNR 
Patrimonio librario   consistenza in volumi e copertura delle tematiche del corso   Accesso alla Biblioteca SNS, a scaffale aperto con un patrimonio librario che raggiunge attualmente circa 900.000 unità (informazioni dettagliate al link http://biblio.sns.it/); accesso alle biblioteche e patrimonio librario del Sistema Bibliotecario di Ateneo dell'Università di Pisa, che dispone di oltre 1.200.000 monografie ed oltre 30.000 riviste scientifiche, di cui oltre 10.000 online; accesso alla Biblioteca di area del CNR 
abbonamenti a riviste (numero, annate possedute, copertura della tematiche del corso)   Le banche dati delle istituzioni partecipanti danno accesso a tutte le maggiori riviste dei settori scientifico-disciplinari di pertinenza del Phd 
E-resources   Banche dati (accesso al contenuto di insiemi di riviste e/o collane editoriali)   SNS - accesso, sia da postazioni interne sia dall'esterno con VPN, a numerose banche dati e periodici elettronici. L'elenco completo delle banche dati è disponibile al link http://biblio.sns.it/banchedati/
accesso alla e-Infrastructure di SoBigdata.eu con i suoi 65 datasets nelle aree tematiche Mobility Data Mining, Social Media mining, Text Mining, Visual Analytics, Network Analytics
 
Software specificatamente attinenti ai settori di ricerca previsti   Accesso alla e-Infrastructure di SoBigdata.eu con i suoi più di cento metodi nelle aree tematiche Mobility Data Mining, Social Media mining, Text Mining, Visual Analytics, Network Analytics 
Spazi e risorse per i dottorandi e per il calcolo elettronico   Aule per la didattica presso tutte le istituzioni partner; risorse per il calcolo elettronico 
Altro    


Note


7. Requisiti e modalità di ammissione

Requisiti richiesti per l'ammissione

Tutte le lauree magistrali: SI, Tutte 
se non tutte, indicare quali:  
Altri requisiti per studenti stranieri:  
Eventuali note  


Modalità di ammissione

Modalità di ammissione
Titoli
Prova orale
Progetto di ricerca
 
Per i laureati all'estero la modalità di ammissione
è diversa da quella dei candidati laureati in Italia?
NO 
se SI specificare:  


Attività dei dottorandi

È previsto che i dottorandi possano svolgere attività di tutorato SI
 
 
È previsto che i dottorandi possano svolgere attività di didattica integrativa SI
 
Ore previste: 40 


Note

(MAX 1.000 caratteri):
Il valore "40" nel campo relativo alle ore di didattica integrativa che i dottorandi possono svolgere indica il limite massimo delle ore effettuabili in un
anno accademico



Dottorato innovativo a caratterizzazione internazionale

• Dottorato in collaborazione con Università e/o enti di ricerca esteri   NO
 
 
• Dottorato relativo alla partecipazione a bandi internazionali (e.g. Marie Skłodowska Curie Actions, ERC)   NO   
• Collegio di dottorato composto per almeno il 25% da docenti appartenenti a qualificate università o centri di ricerca stranieri   NO   
• Presenza di eventuali curricula in collaborazione con Università/Enti di ricerca estere e durata media del periodo all'estero dei dottori di ricerca pari almeno a 12 mesi   NO
 
 
• Presenza di almeno 1/3 di iscritti al Corso di Dottorato con titolo d'accesso acquisito all'estero ***   SI   


Dottorato innovativo a caratterizzazione intersettoriale

• Dottorato in convenzione con Enti di Ricerca   SI
 
Motivazione:
L'infrastruttura europea di ricerca SoBigData.eu, che fornisce l'ecosistema di laboratori di ricerca toscani ed internazionali su cui è basato il PhD in Data Science, è coordinata dal CNR, attraverso l'Istituto di Scienza e Tecnologia dell'Informazione dell'Area CNR di Pisa. I membri CNR nel collegio ricomprendono i responsabili dei laboratori ISTI-CNR e IIT-CNR coinvolti in SoBigData.eu e la coordinatrice dell'infrastruttura europea di ricerca, Fosca Giannotti.
 
• Dottorato in convenzione con le imprese o con enti che svolgono attività di ricerca e sviluppo   NO
 
 
• Dottorato selezionato su bandi internazionali con riferimento alla collaborazione con le imprese   NO
 
 
• Dottorati inerenti alle tematiche dell’iniziativa “Industria 4.0  SI
 
Motivazione:
Con “Industria 4.0” ci si riferisce a una modalità organizzativa della produzione di beni e servizi che fa leva sull’integrazione degli impianti e dei processi con le tecnologie digitali, associata a un impiego sempre più pervasivo di dati e informazioni, di tecnologie computazionali e di analisi dei dati, di nuovi materiali e componenti digitalizzati e interconnessi. L’obiettivo è creare sistemi ibridi (produttivi, commerciali, logistici) che siano in grado di gestire, interpretare e valorizzare la grande mole di dati generate dall’utilizzo delle tecnologie digitali. Pertanto, la “big data analytics” e la “data science”, oggetto di questo dottorato, costituiscono un pilastro scientifico-tecnologico per l’industria 4.0. Nel Piano Nazionale Industria 4.0 2017-2020 del Ministero dello Sviluppo Economico, “Big Data & Analytics” è indicata come una delle 9 tecnologie abilitanti. Lo stesso piano prevede di investire nello sviluppo delle competenze relative finanziando dottorati di ricerca.
 
• Presenza di convenzione con altri soggetti istituzionali su specifici temi di ricerca o trasferimento tecnologico e che prevedono una doppia supervisione   NO
 
 


Dottorato innovativo a caratterizzazione interdisciplinare

• Dottorati (con esclusione di quelli suddivisi in curricula) con iscritti provenienti da almeno 2 aree CUN, rappresentata ciascuna per almeno il 30% (rif. Titolo LM o LMCU )   NO   
• Corsi appartenenti a Scuole di Dottorato che prevedono contestualmente ambiti tematici relativi a problemi complessi caratterizzati da forte multidisciplinarità   NO
 
 
• Dottorati inerenti alle tematiche dei

Big Data
, relativamente alle sue metodologie o applicazioni
 
SI
 
Motivazione:
Intorno all’Univ. di Pisa, agli Istituti ISTI e IIT del CNR e alle scuole SNS, S. ANNA e IMT si è coagulata una massa critica di ricercatori di Data Science e Big Data che hanno dato vita, dal 2000, ai primi progetti europei e alle prime esperienze europee di formazione dei Data Scientist. La Commissione Europea ha scelto nel 2015 questo consorzio, a guida CNR, per l’infrastruttura europea di ricerca H2020 sui Big Data. SoBigData.eu è una rete di centri europei che mette a disposizione dati, strumenti e competenze per grandi esperimenti di big data analytics da parte di ricercatori, innovatori, policy-makers, istituzioni pubbliche. SoBigData rende accessibili i Big Data come risorsa pubblica per la open data science, in un quadro etico di trasparenza e responsabilità. Il rapporto BigData/MIUR riconosce (p. 33) SoBigData come piattaforma per la formazione alla ricerca nella Data Science, in cui i dottorandi possono sfruttare i laboratori di ricerca e la rete di relazioni internazionali
 
• Dottorati che rispondono congiuntamente ai seguenti criteri      
presenza nel Collegio di Dottorato di docenti afferenti ad almeno due aree CUN, rappresentata ciascuna per almeno il 20% nel Collegio stesso   SI   
somma degli indicatori (R + X1 + I) almeno pari a 2,8 per ciascuna area   (dato disponibile successivamente alla valutazione di ANVUR)   
presenza di un tema centrale che aggreghi coerentemente discipline e metodologie diverse, anche con riferimento alle aree ERC   SI  Motivazione:
La "data science" è un paradigma inter-disciplinare, finalizzato a valorizzare le grandi masse di dati prodotte dalla trasformazione digitale della società, estraendone conoscenza. In questo nuovo paradigma scientifico le teorie e i modelli coesistono con la scoperta di conoscenze che emergono dai dati, supplementadosi. Gli esperimenti e le analisi "data-driven" non servono solo alla validazione di teorie e modelli, ma anche alla scoperta di pattern nei dati, che possono aiutare gli scienziati di ogni disciplina a disegnare nuove teorie e modelli e comprendere più a fondo la complessità dei fenomeni sociali, economici, biologici, tecnologici, culturali, fisici e naturali.
 


Chiusura proposta e trasmissione: 05/04/2018


.