Anno accademico 2006/2007 - lauree triennali

[ELENCO COMPLETO]
  1. Sicurezza dei sistemi informativi.
  2. Sistemi di telecomunicazioni.
  3. Sistemi informativi aziendali.
  4. Sistemi operativi 1.
  5. Sistemi operativi 2.
  6. Statistica matematica 1.
  7. Statistica matematica 2.
  8. Strumenti di gestione della sostenibilità.
  9. Tecniche e strumenti di analisi dei dati.
  10. Tecnologie informatiche per il territorio.
  11. Teoria dei sistemi.
  12. Teoria delle reti 1.
  13. Teoria delle reti 2.
  14. Termodinamica.

93. Tecniche e strumenti di analisi dei dati

prof. Francesco Civardi


OBIETTIVO DEL CORSO

“La crescente disponibilità di dati nell'attuale società dell'informazione
ha evidenziato la necessità di disporre di strumenti adeguati per la loro
analisi.  La statistica applicata ed il data mining si propongono come
strumenti privilegiati per estrarre informazioni da questi dati.” (Paolo
Giudici, Data Mining, McGraw-Hill, 2001).

Obiettivo del corso è fornire allo studente la padronanza dei concetti che
gli  permettano  di  applicare  tecniche  di  analisi  dei dati, “data
warehousing”, “OLAP”, “data mining” e “machine learning” (algoritmi che
apprendono) a diverse aree applicative.

Tali concetti nascono all'intersezione di varie discipline: l'Intelligenza
Artificiale, la Statistica, i Metodi Bayesiani, la Teoria dell'Informazione,
la Teoria del Controllo, la Teoria della Complessità Computazionale, la
Neurofisiologia.

Le aree applicative spaziano dalla diagnosi medica all'analisi del rischio
di  credito  dei  clienti di una banca, dall'analisi del comportamento
d'acquisto della clientela di un supermercato all'ottimizzazione di processi
industriali, fino all'individuazione precoce di epidemie o attacchi di
bioterrorismo (biosorveglianza).

PROGRAMMA DEL CORSO

* Introduzione alla Business Intelligence, all'OLAP e al Data Mining
* Concetti di DataWarehousing
* Analisi multi-dimensionale. Modellazione Dimensionale
* Data Base Relazionali e Multidimensionali
* Richiami del linguaggio SQL
* Introduzione al linguaggio MDX
* Temi  del  Data  Mining:  Classificazione, Predizione, Clustering,
Associazione
* Alberi Decisionali. Entropia e Information Gain
* Richiami di teoria delle probabilità. Teorema di Bayes.
* Classificatori Bayesiani
* Reti bayesiane
* Regressioni
* Reti neuronali
* Cluster Analysis: Algoritmi EM e K-Means; Algoritmi gerarchici.
* Analisi delle associazioni (A-priori)
* Concetti di analisi delle serie storiche

BIBLIOGRAFIA

Slides e appunti delle lezioni.

Siti web comunicati a lezione.

Calo Vercellis, Business Intelligence - Modelli matematici e sistemi per le
decisioni, McGraw-Hill, 2006

Per consultazione:

Ralph Kimball, Data Warehouse: La guida completa, Hoepli, 2002

Richard  J.  Roiger  -  Michael W. Geatz, Introduzione al Data Mining,
McGraw-Hill, 2004

Paolo Giudici, Data Mining. Metodi statistici per le applicazioni aziendali,
McGraw-Hill, 2001

Ian H. Witten - Eibe Frank, Data Mining, Practical Machine Learning Tools
and Techniques with Java implementations, Morgan Kaufmann, 1999

Tom Mitchell, Machine learning, McGraw-Hill, 1997

Jaiwei Han e Micheline Kamber, Data Mining: Concepts and Techniques, Morgan
Kaufmann, 2001.

DIDATTICA DEL CORSO

Lezioni frontali in aula, progetti al computer con il software free Weka,
dimostrazioni su MSFT SQL Server / Analysis Services.

METODO DI VALUTAZIONE

La valutazione sarà basata sulla partecipazione attiva al corso e su di un
esame finale (scritto / orale).

AVVERTENZE

Il Prof. Francesco Civardi riceve gli studenti prima e dopo le lezioni,
nello studio presso il Dipartimento di Matematica e Fisica, Via Musei 41.

Ulteriori  informazioni  si  possono  trovare  sul  sito  del docente:
http://www2.unicatt.it/unicattolica/docenti/index.html o nella bacheca della
Facoltà.


[ Facoltà di Scienze ]