Distribuzioni a due caratteri
Utilizzo dei comandi del
foglio elettronico: “media”, “mediana”, “covarianza”, “correlazione”,
“var.pop”, "dev.st.pop”, “percentile”
Utilizzo dei comandi del foglio
elettronico: “inserisci grafico” con le opportune
opzioni
Esercizio D1.
Sono stati rilevati i
seguenti valori biometrici di undici soggetti:
peso
|
66
|
52
|
94
|
97
|
62
|
60
|
66
|
90
|
88
|
73
|
81
|
altezza
|
169
|
155
|
168
|
160
|
166
|
166
|
170
|
188
|
186
|
179
|
181
|
Calcolare per mezzo del foglio elettronico i seguenti indici
statistici: la media,
la mediana, il primo e il terzo quartile, la deviazione standard.
Rappresentare i dati con un grafico di tipo cartesiano
("dispersioneXY", "scattering") ed individuare una
eventuale linea di tendenza.
Individuare l'equazione cartesiana dell'eventale linea di tendenza.
Calcolare per mezzo del foglio elettronico il coefficiente di
correlazione di Pearson.
Esercizio D2.
Un laboratorio
microbiologico dispone delle seguenti
osservazioni:
tempo
|
4
|
5
|
6
|
7
|
9
|
10
|
batteri
|
15
|
45
|
73
|
212
|
625
|
1677
|
Individuare una opportuna linea di tendenza con un foglio elettronico.
Esercizio D3.
Queste due tabelle
riportano i tassi di mortalità infantile rispettivamente di un
Paese europeo e di uno africano:
1960
|
1965
|
1970
|
1971
|
1972
|
1973
|
1974
|
1975
|
1976
|
1977
|
1978
|
1979
|
26
|
24,7
|
20
|
19,1
|
18,5
|
17,7
|
16,7
|
16,1
|
15,2
|
14,1
|
13,8
|
13
|
1960
|
1965
|
1970
|
1975
|
1980
|
1985
|
1990
|
1995
|
2000
|
500
|
396
|
280
|
207
|
142
|
80
|
53
|
32
|
18
|
Siete in
grado di individuare una linea di tendenza per i due Paesi, e prevedere
quale potrebbe essere per il 2000 il tasso di mortalità in
quello europeo, e nel 2010 in quello africano?
Esercizio D4.
Si dispone dei seguenti
dati su un
campione di 5
pazienti, dove xi è la dose di farmaco somministrato
(misurata in mg), yi è la diminuzione della
pressione arteriosa (misurata in mmHg):
xi
|
7
|
12
|
15
|
20
|
22
|
yi
|
10
|
18
|
20
|
25
|
25
|
Si determini l'equazione della retta di regressione, y = a·x +
b, ed il
coefficiente di Pearson.
Si determini l'equazione della retta di regressione in scala
semilogaritmica rispetto ai valori xi
e z = c·ln(x) + d.
Commentare i risultati ottenuti e, in particolare:
* cosa succede nel primo caso per x = 0, e cosa significa?
* cosa succede nel primo caso per x = 25 e cosa significa?
* cosa succede nel secondo caso per x = 25 e cosa
significa?
nel secondo caso: qual è la dose di farmaco per cui non
ci si aspetta diminuzione di pressione?
Esercizio D5.
E’ data la seguente
tabella di dati (xi,yi), i =
1 , ... , 12 , che rappresenta rispettivamente l’altezza ed il
volume d’aria espirata (FEV)
misurata in dodici soggetti:
xi |
134
|
138
|
142
|
146
|
150
|
154
|
158
|
162
|
166
|
170
|
174
|
178
|
yi |
1.7
|
1.9
|
2.0
|
2.1
|
2.2
|
2.5
|
2.7
|
3.0
|
3.1
|
3.4
|
3.8
|
3.9
|
Calcolare le medie aritmetiche xm e ym e le due
mediane.
Individure l’equazione della retta di regressione y = a·x +
b
Quale volume di aria espirata ci si aspetta da una persona alta 160
centimetri? E
da una alta 1 metro? Commentare tali
risultati.
Esercizio D6.
Supponiamo di poter
distinguere un campione di individui, maschi e femmine, in tre distinte
categorie epidemiologiche, secondo la seguente tabella di contingenza,
completata parzialmente:
|
maschi |
femmine |
totale |
suscettibili |
|
22,5% |
56,7% |
infetti |
12,8% |
|
|
rimossi |
|
8,3% |
|
totale |
|
36,1% |
100,0% |
Si completi
integralmente la tabella. In base a tali percentuali, riferendosi ad un
campione 360 individui, quanti potrebbero essere gli individui maschi
rimossi? E quanti gli individui infetti?
Esercizio
D7.
Si dispone dei seguenti
dati su un campione di 14 pazienti, dove xi è la dose di farmaco
(in mg), yi è la diminuzione della pressione arteriosa (in mmHg):
xi
|
5
|
5
|
7
|
7
|
8
|
9
|
11
|
11
|
12
|
15
|
20
|
22
|
24
|
24
|
yi |
3 |
8 |
10 |
9 |
9 |
12 |
8 |
15 |
18 |
20 |
25 |
25 |
24 |
25 |
Si trovino
la retta di regressione e altre linee di tendenza opportune.
Commentare i risultati ottenuti e, in particolare, cosa succede, per le
varie linee di tendenza per x=0 e per x= 25 e cosa
significa?
Esercizio D8.
Questa tabella riporta il
numero di battiti cardiaci al minuto in giovani soggetti sani.
polso
|
70
|
89
|
76
|
87
|
78
|
89
|
76
|
77
|
84
|
80
|
età |
6 |
3 |
5 |
3 |
4 |
2 |
5 |
4 |
3 |
2 |
Si determini con il foglio di
calcolo il coefficiente di correlazione di Pearson.
Esercizio D9.
Per monitorare
l'insorgenza di un tipo di tumore al seno, una popolazione di 13465
donne non nullipare viene suddivisa in due classi, quella di età
minore od uguale a 29 anni e quella maggiore od uguale a 30. Dalla
suddivisione ulteriore in "casi" e "controlli", risulta che 625 sono i
casi di età maggiore uguale a 30 e che 8738 sono i controlli di
età minore od uguale a 29 anni. Sapendo che il totale dei casi
è 3520, creare un tavola di contingenza che riporti le
distribuzioni di frequenza relativa.
Calcolando le distribuzioni marginali, si determinino le frequenze
attese. Si tratta di dati statisticamente indipendenti?
Esercizio D10. (Paradosso di Simpson)
Si effettua una
sperimentazione con due trattamenti clinici, A e B, per la medesima
patologia, ma in due ospedali diversi. Le due tavole di contingenza ne
riportano gli
esiti.
Ospedale # 1 |
deceduti |
sopravvissuti |
totale |
trattamento A
|
160
|
40 |
200 |
trattamento B
|
170 |
30
|
200
|
totale |
330
|
70 |
400 |
Ospedale # 2 |
deceduti |
sopravvissuti |
totale |
trattamento A
|
15
|
85 |
100 |
trattamento B
|
100 |
300
|
400
|
totale |
115
|
385 |
500 |
Quanto valgono le percentuali
di sopravvissuti ai trattamenti A e B,
nei due ospedali?
Sulla base di queste percentuali, quale dei trattamenti si dovrà
dunque preferire?
Si aggreghino i dati, creando un'unica tavola di contingenza. Quanto
valgono le percentuali di sopravvissuti ai trattamenti A e B? Quale dei
trattamenti si dovrà dunque preferire? Commentate il risultato.