STATISTICA E MANAGEMENT
Modulo STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA

Anno accademico 2022/2023 - Docente: MASSIMO COSTANZO

Risultati di apprendimento attesi

Data la natura degli obiettivi, il “format” del Corso privilegia la discussione e un’attiva partecipazione degli studenti in aula. Si consiglia di leggere preventivamente i contenuti della lezione in modo da facilitare la comprensione delle principali tematiche e la loro discussione in aula.

Modalità di svolgimento dell'insegnamento

Modalità di erogazione del corso di insegnamento:
Lezioni frontali, partecipazione attiva degli studenti tramite domande, preparazione di un questionario per la raccolta dei dati e la successiva raccolta dei dati ed esercizi.

VALUTAZIONE: Esame Scritto con due quesiti ed esame orale con commento di articolo scientifico.

Prerequisiti richiesti

Conoscenze di base di matematica e statistica

Frequenza lezioni

Obbligatoria

Contenuti del corso

Generalità e premesse
- Ruolo della statistica in medicina.  
- Evidence Based Medicine e uso di motori di ricerca specializzati: Health on the Net foundation,
PubMed, Cochrane Library.
Statistica epidemiologica
- Eventi sanitari
- Misurare l'occorrenza di malattia: prevalenza, incidenza, rischio e tasso.
- Prevalenza e incidenza, relazione di causa-effetto, popolazioni e gruppi a rischio
- Studi sul rischio: Misure di associazione: il rischio relativo ed il rapporto tra odds. Studi osservazionali descrittivi. Studi osservazionali analitici (trasversali, longitudinali o di coorte e retrospettivi o caso-controllo). Studi sperimentali. Dalla fase I alla fase IV. Studi in cieco semplice e doppio. Il braccio di controllo. La randomizzazione. Etica e sperimentazione clinica.
- Test diagnostici e test di screening: loro valutazione
- Sensibilità e specificità di un test diagnostico.
- Valori predittivi: Valore predittivo di un test diagnostico (teorema di Bayes).
- Indicatori ospedalieri
- Indicatori di struttura e di utilizzo
- Nomogramma di Barber, e di Gandy
- Indicatori di processo e di esito
- VRQ: una metodologia per la valutazione di qualità
Cenni di calcolo delle probabilità
- Insiemistica operazioni tra insiemi
- Quesiti anomali, probabilità e inferenza statistica
- Frequenza relativa, esiti possibili, eventi.
- Teoria e calcolo delle probabilità
Probabilità di un evento
Principio della somma Principio del prodotto e probabilità indipendenti
Probabilità condizionate eventi indipendenti e dipendenti
Unione di eventi, eventi incompatibili
Eventi condizionati, intersezione di eventi, eventi indipendenti.
- Distribuzioni di probabilità discrete e continue
- Definizione di variabile casuale.
- Variabili casuali discrete Creazione di una variabile casuale discreta.
- Variabili casuali continue
- Variabile casuale Binomiale.
- Media e varianza di una variabile casuale.
Distribuzione binomiale, normale e di Poisson
- Il modello Gaussiano standard, gli z-scores, l'uso delle tavole e del calcolatore per il calcolo delle
probabilità.
- Distribuzione binomiale, multinomiale e di Poisson
Campionamento e inferenza statistica
- Popolazione e campione
Popolazione finita e infinita
Teoria elementare dei campioni
- Campioni casuali e numeri casuali
- Dimensione del campione
- Rappresentatività del campione
- Errore di campionamento
- Tecniche di campionamento
Campionamento con e senza ripetizione
Campionamento casuale (randomizzazione)
Campionamento stratificato
Campionamento sistematico
Campionamento a presentazione
- Tabelle dei numeri casuali
Suddivisione casuale di un campione in due o più gruppi
- Distribuzioni campionarie
- Errori standard
- Distribuzione della media campionaria: errore standard di una media campionaria e intervallo di
probabilità.
- Teorema del limite centrale.
- Distribuzione delle varianze campionarie (Chi-quadrato): forma della distribuzione χ2 in funzione
dei gradi di libertà (ν).
- Distribuzione dei rapporti tra una v.c. gaussiana con media 0 e la radice di una v.c. Chi-quadrato:
la v.c. t di Student
Teoria statistica della stima
- La logica dell'inferenza statistica.  
Stima dei parametri: stime corrette ed efficienti
Stime puntuali e stime per intervalli
- Intervalli di confidenza per le stime dei parametri
Dimensione del campione per l'intervallo di confidenza.
Stima intervallare di una media: Intervallo di confidenza della media.
Stima intervallare di una frequenza percentuale
- Errore probabile
Teoria delle decisioni statistiche
- Il concetto di test di ipotesi: formulazione dell'ipotesi.
Ipotesi statistica, ipotesi nulla, Verifica d'ipotesi - Test di significatività e di ipotesi
- Il concetto di test di ipotesi: criterio di decisione e rischi di errore di tipo I (α) e di tipo II (β);
- Livello di significatività
- Test implicanti la distribuzione normale e binomiale
- Test a una e a due code
- Potenza di un test
- Test di significatività che implichino differenze campionarie
Teoria dei piccoli campioni
- La distribuzione t di STUDENT
- Intervalli di confidenza
- Test di ipotesi e di significatività
- La distribuzione CHI QUADRATO
- Intervalli di confidenza per CHI QUADRATO
- Gradi di libertà
- il test CHI QUADRATO: frequenze osservate e teoriche, definizione, test della significatività,
bontà di adattamento, tabelle di contingenza, correlazione di Yates per la continuità, formule per il
calcolo, coefficiente di contingenza, correlazione tra gli attributi
L'interpolazione e il metodo dei minimi quadrati
- relazioni tra variabili
- interpolazione
- il metodo dei minimi quadrati
- la regressione
Teoria della correlazione
- distribuzione campionaria congiunta di due variabili: codevianza, covarianza, e coefficiente di
correlazione.
- correlazione lineare
- errore standard della stima
- devianza spiegata e residua
- teoria campionaria della regressione e della correlazione
Correlazione multipla e parziale
- correlazione multipla
- equazione di regressione, piano di regressione
- errore standard della stima
- coefficiente di correlazione multipla
- correlazione parziale
- regressione multipla non lineare
Statistica non parametrica
- Semplici programmi informatici di calcolo statistico
- Campionamento di convenienza
- Shapiro-Wilk test o Normality test
- Test t-Student e Man Whitney per gruppi differenti non accoppiati
- Test t-Student e Wilcoxon test per gruppi accoppiati
- Test Anova e Kruskal-Wallis per una variabile in più gruppi di persone diverse o dopo trattamenti
differenti
- Test Anova e Friedman per più variabili o una stessa variabile in tempi differenti
- Correlazione negativa e positiva test di Pearson e di Spearman
- I box plot
Analisi della sopravvivenza
- Metodi di Kaplan-Meier
- Modello di Cox
- Metanalisi
Modelli di decisione in ambito medico
- Stochastic Multicriteria Acceptability Analysis (SMAA)

Testi di riferimento

Materiale didattico e bibliografia  
Bibliografia:

Daniel W Biostatistica EdiSES Napoli 1996 pp 736

oppure
Lantieri, B.L., Risso D., Ravera G. (revisione Lama N., Signoriello G.) (2007). Elementi di Statistica Medica. Milano: McGraw-Hill.
Chiari, Mosci, Naldi, Evidence based clinical practice - La pratica clinico assistenziale basata su prove di efficacia - McGraw-Hill

Programmazione del corso

 ArgomentiRiferimenti testi
1STATISTICA INFERENZIALE LANTIERI
2APPLICAZIONI IN AMBITO MEDICOCHIARI
3TEST DIAGNOSTICICOSTANZO

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

Esame Scritto con due quesiti ed esame orale con commento di articolo scientifico.

Esempi di domande e/o esercizi frequenti

QUESITO A)

Remein e Wilkerson (The efficiency of screening test s for diabetes. Journal of chronic diseases, 13:6-21; 1961) considerarono un certo numero di test per l’individuazione del diabete. Avevano un gruppo di criteri di raffronto, che costituivano il loro ‘gold standard’, per stabilire se un soggetto presentava realmente tale malattia. La tabella presenta i risultati dell’esame del sangue Folin-Wu effettuato 1 ora dopo il pasto e considerando positivi i soggetti con un livello di glicemia superiore a 150 mg/100ml. Furono screenati un totale di 580 soggetti, 70 dei quali erano diabetici. 475 soggetti risultarono negativi al test, di questi 14 erano diabetici.

Costruire la tavola di contingenza 2x2.

Si verifichi l'associazione tra i dati svolgendo il test con almeno due livelli di significatività. Si formulino correttamente le ipotesi.

QUESITO B)

Data la seguente serie di dati:

Si dica:

  1. Il tipo di variabile

  2. Si rappresenti graficamente la frequenza relativa e cumulata

  3. Si calcoli moda, mediana e media

  4. Si calcoli la deviazione standard

ENGLISH VERSION