Fenomeni associati e indipendenti

G. M. Marchetti

22-23 febbraio 2017

Prima parte

In cui si parla

di relazioni causali

di dati aggregati e disaggregati

di casi paradossali

dei Simpson (!)

e… di discriminazioni

Causa ed effetto

Un esperimento su un farmaco

Teniamo conto del genere del paziente

Genere Farmaco usato Farmaco non usato
Maschi 81 su 87 guariti (93%) 200 su 270 guariti (87%)
Femmine 192 su 263 guariti (73%) 55 su 80 guariti (69%)
Tutti 273 su 350 guariti (78%) 289 su 350 guariti (83%)

Paradosso di Simpson

Analisi del paradosso

Capire la storia dietro ai dati

Associazione in una tabella

Probabilità

Indipendenza

Come si misura l’associazione?

Torniamo ai dati sulle guarigioni

Alcune convinzioni errate

Analisi

La storia dietro i dati

Che succede?

\[ \begin{array}{lrrrr}\hline Vittima & Accusato & Pena\; capitale & Ergastolo & Totale & Proporzione\\ \hline bianco & bianco & 5 &45 & 50& 0.10\\ & nero & 2 & 8 & 10& 0.20\\ \hline nero & bianco & 2 &18 & 20& 0.10\\ & nero & 1 &19 & 20& 0.05 \\\hline \end{array} \]

Relazioni apparenti

Una storia diversa

Seconda parte

In cui si parla:

di esperimenti controllati

di relazioni lineari approssimate

di correlazione e di regressione

e riappare … il solito Simpson.

L’esperimento di Forbes

I dati

temperatura:
 90.28 90.17 92.17 92.44 93 93.28 93.83 93.94 94.11 94.06 
 95.33 95.89 98.61 98.11 99.28 99.94 100.1 
pressione:
 528.1 528.1 569 575.8 588 593.1 606.8 609.3 610.1 609.9 
 638.6 674.9 723.6 705.1 737.6 759 763.5 

Andamento lineare

Legge di Forbes

Relazioni matematiche

La retta

Relazioni statistiche

Stima dei minimi quadrati

Risultati e interpretazione

Una associazione lineare tra misure antropometriche

sesso scarpe altezza
m 39 170
f 40 170
f 37 162
f 38 160
f 38 157
m 42 169

Lo scatter

La relazione lineare stimata

Minimi quadrati

Minimi quadrati

Minimi quadrati

Relazioni con andamento decrescente

Forza della relazione lineare

Esempi di correlazione lineare

Strumenti sul web

Incorrelazione

Incorrelazione non è indipendenza!

Variabili multiple

Esempio

Associazione tra esercizio fisico e tasso di colesterolo

Che succede quando si ignora l’età?

Che cosa abbiamo imparato?