Distribuzioni a due caratteri

Utilizzo dei comandi del foglio elettronico: “media”, “mediana”, “covarianza”, “correlazione”, “var.pop”, "dev.st.pop”, “percentile”
Utilizzo dei comandi del foglio elettronico: “inserisci grafico” con le opportune opzioni


Esercizio D1.
Sono stati rilevati i seguenti valori biometrici di undici soggetti:

peso
66
52
94
97
62
60
66
90
88
73
81
altezza
169
155
168
160
166
166
170
188
186
179
181

Calcolare per mezzo del foglio elettronico i seguenti indici statistici: la media, la mediana, il primo e il terzo quartile, la deviazione standard.
Rappresentare i dati con un grafico di tipo cartesiano ("dispersioneXY", "scattering") ed individuare una eventuale linea di tendenza.
Individuare l'equazione cartesiana dell'eventale linea di tendenza.
Calcolare per mezzo del foglio elettronico il coefficiente di correlazione di Pearson.


Esercizio D2.
Un laboratorio microbiologico dispone delle seguenti osservazioni:

tempo
4
5
6
7
9
10
batteri
15
45
73
212
625
1677

Individuare una opportuna linea di tendenza con un foglio elettronico.

Esercizio D3.
Queste due tabelle riportano i tassi di mortalità infantile rispettivamente di un Paese europeo e di uno africano:

1960
1965
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
26
24,7
20
19,1
18,5
17,7
16,7
16,1
15,2
14,1
13,8
13


1960
1965
1970
1975
1980
1985
1990
1995
2000
500
396
280
207
142
80
53
32
18

Siete in grado di individuare una linea di tendenza per i due Paesi, e prevedere quale potrebbe essere per il 2000 il tasso di mortalità in quello europeo, e nel 2010 in quello africano?

Esercizio D4.
Si dispone dei seguenti dati su un campione di 5 pazienti, dove xi è la dose di farmaco somministrato (misurata in mg), yi è la diminuzione della pressione arteriosa (misurata in mmHg):


xi
7
12
15
20
22
yi
10
18
20
25
25

Si determini l'equazione della retta di regressione, y = a·x + b, ed il coefficiente di Pearson.
Si determini l'equazione della retta di regressione in scala semilogaritmica rispetto ai valori xi e z = c·ln(x) + d.
Commentare i risultati ottenuti e, in particolare:
* cosa succede nel primo caso per x = 0, e cosa significa?
* cosa succede nel primo caso per x = 25 e cosa significa?
* cosa succede nel secondo caso per x = 25 e cosa significa?
nel secondo caso: qual è la dose di farmaco per cui non ci si aspetta diminuzione di pressione?
Esercizio D5.
E’ data la seguente tabella di dati (xi,yi), i = 1 , ... , 12 , che rappresenta rispettivamente l’altezza ed il volume d’aria espirata (FEV) misurata in dodici soggetti:

xi 134
138
142
146
150
154
158
162
166
170
174
178
yi 1.7
1.9
2.0
2.1
2.2
2.5
2.7
3.0
3.1
3.4
3.8
3.9

Calcolare le medie aritmetiche xm e ym e le due mediane.
Individure l’equazione della retta di regressione y = a·x + b
Quale volume di aria espirata ci si aspetta da una persona alta 160 centimetri? E da una alta 1 metro?  Commentare tali risultati.


Esercizio D6.
Supponiamo di poter distinguere un campione di individui, maschi e femmine, in tre distinte categorie epidemiologiche, secondo la seguente tabella di contingenza, completata parzialmente:


maschi femmine totale
suscettibili
22,5% 56,7%
infetti 12,8%

rimossi
8,3%
totale
36,1% 100,0%

Si completi integralmente la tabella. In base a tali percentuali, riferendosi ad un campione 360 individui, quanti potrebbero essere gli individui maschi rimossi? E quanti gli individui infetti?

Esercizio D7.
Si dispone dei seguenti dati su un campione di 14 pazienti, dove xi è la dose di farmaco (in mg), yi è la diminuzione della pressione arteriosa (in mmHg):

xi
5
5
7
7
8
9
11
11
12
15
20
22
24
24
yi 3 8 10 9 9 12 8 15 18 20 25 25 24 25

Si trovino la retta di regressione e altre linee di tendenza opportune.  Commentare i risultati ottenuti e, in particolare, cosa succede, per le varie linee di tendenza per x=0 e per x= 25 e cosa significa?


Esercizio D8.
Questa tabella riporta il numero di battiti cardiaci al minuto in giovani soggetti sani.

polso
70
89
76
87
78
89
76
77
84
80
età 6 3 5 3 4 2 5 4 3 2

Si determini con il foglio di calcolo il coefficiente di correlazione di Pearson.


Esercizio D9.
Per monitorare l'insorgenza di un tipo di tumore al seno, una popolazione di 13465 donne non nullipare viene suddivisa in due classi, quella di età minore od uguale a 29 anni e quella maggiore od uguale a 30. Dalla suddivisione ulteriore in "casi" e "controlli", risulta che 625 sono i casi di età maggiore uguale a 30 e che 8738 sono i controlli di età minore od uguale a 29 anni. Sapendo che il totale dei casi è 3520, creare un tavola di contingenza che riporti le distribuzioni di frequenza relativa.
Calcolando le distribuzioni marginali, si determinino le frequenze attese. Si tratta di dati statisticamente indipendenti?

Esercizio D10. (Paradosso di Simpson)
Si effettua una sperimentazione con due trattamenti clinici, A e B, per la medesima patologia, ma in due ospedali diversi. Le due tavole di contingenza ne riportano gli esiti.

Ospedale # 1 deceduti sopravvissuti totale
trattamento A
160
40 200
trattamento B
170 30
200
totale 330
70 400


Ospedale # 2 deceduti sopravvissuti totale
trattamento A
15
85 100
trattamento B
100 300
400
totale 115
385 500

Quanto valgono le percentuali di sopravvissuti ai trattamenti A e B, nei due ospedali?
Sulla base di queste percentuali, quale dei trattamenti si dovrà dunque preferire?
Si aggreghino i dati, creando un'unica tavola di contingenza. Quanto valgono le percentuali di sopravvissuti ai trattamenti A e B? Quale dei trattamenti si dovrà dunque preferire? Commentate il risultato.