Anno accademico 2009/2010 - lauree triennali

[ELENCO COMPLETO]
  1. Ricerca operativa 1.
  2. Ricerca operativa 2.
  3. Sicurezza dei sistemi informativi.
  4. Sistemi informativi e territoriali.
  5. Sistemi operativi 1.
  6. Sistemi operativi 2.
  7. Statistica matematica 1.
  8. Statistica matematica 2.
  9. Tecniche e strumenti di analisi dei dati.
  10. Teoria dei sistemi.
  11. Teoria delle reti (prima unità).
  12. Teoria delle reti (seconda unità).
  13. Termodinamica.
  14. Valutazione di impatto ambientale.

81. Tecniche e strumenti di analisi dei dati

prof. Francesco Civardi


OBIETTIVO DEL CORSO

"La crescente disponibilità di dati nell'attuale società dell'informazione ha evidenziato la
necessità di disporre di strumenti adeguati per la loro analisi. La statistica applicata ed il
data mining si propongono come strumenti privilegiati per estrarre informazioni da questi
dati." (Paolo Giudici, Data Mining, McGraw-Hill, 2001).
Obiettivo del corso è fornire allo studente la padronanza dei concetti che gli permettano
di applicare tecniche di analisi dei dati, "data warehousing", "OLAP", "data mining" e
"machine learning" (algoritmi che apprendono) a diverse aree applicative.
Tali concetti nascono all'intersezione di varie discipline: l'Intelligenza Artificiale, la Statistica,
i Metodi Bayesiani, la Teoria dell'Informazione, la Teoria del Controllo, la Teoria della
Complessità Computazionale, la Neurofisiologia.
Le aree applicative spaziano dalla diagnosi medica all'analisi del rischio di credito dei clienti

di una banca, dall'analisi del comportamento d'acquisto della clientela di un supermercato
all'ottimizzazione di processi industriali, fino all'individuazione precoce di epidemie o
attacchi di bioterrorismo (biosorveglianza).

PROGRAMMA DEL CORSO

- Introduzione alla Business Intelligence, all'OLAP e al Data Mining
- Concetti di DataWarehousing
- Analisi multi-dimensionale. Modellazione Dimensionale
- Data Base Relazionali e Multidimensionali
- Richiami del linguaggio SQL
- Introduzione al linguaggio MDX
- Temi del Data Mining: Classificazione, Predizione, Clustering, Associazione
- Alberi Decisionali. Entropia e Information Gain
- Richiami di teoria delle probabilità. Teorema di Bayes.
- Classificatori Bayesiani
- Reti bayesiane
- Regressioni
- Reti neuronali
- Cluster Analysis: Algoritmi EM e K-Means; Algoritmi gerarchici.
- Analisi delle associazioni (A-priori)
- Concetti di analisi delle serie storiche

BIBLIOGRAFIA

Slides e appunti delle lezioni
Siti web comunicati a lezione

C. Vercellis, Business Intelligence - Modelli matematici e sistemi per le decisioni, McGraw-Hill, 2006.

Per consultazione:
R. Kimball, Data Warehouse: La guida completa, Hoepli, 2002
R. J. Roiger - M. W. Geatz, Introduzione al Data Mining, McGraw-Hill, 2004
P Giudici, Data Mining. Metodi statistici per le applicazioni aziendali, McGraw-Hill, 2001
.
I. H. Witten - Eibe Frank, Data Mining, Practical Machine Learning Tools and Techniques with Java
implementations, Morgan Kaufmann, 1999
T. Mitchell, Machine learning, McGraw-Hill, 1997
J. Han e M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2001.

DIDATTICA DEL CORSO
Lezioni frontali in aula, progetti al computer con il software free Weka, dimostrazioni su MSFT
SQL Server / Analysis Services.

METODO DI VALUTAZIONE
La valutazione sarà basata sulla partecipazione attiva al corso e su di un esame finale (scritto /orale).

AVVERTENZE
Il prof. Civardi riceve gli studenti prima e dopo le lezioni, nello studio presso il Dipartimento
di Matematica e Fisica, Via Musei 41.
Ulteriori informazioni si possono trovare sul sito del docente: http://www2.unicatt.it/unicattolica/
docenti/index.html o nella bacheca della Facoltà.



[ Facoltà di Scienze ]