Come ci si attendeva, la covarianza purtroppo cambia; ma non il coefficiente di correlazione, che per questo motivo è preferibile.
Nella cella H4 possiamo inserire la formula: = C4/100 e poi, usando la maniglia di trascinamento, copiamo a destra la cella. Poi selezioniamo entrambe le celle e trasciniamo verso il basso. Infine copiamo ed incolliamo la regione da D4 a G14. I riferimenti vengono cambiati automati-camente. |
|
Alla 41-esima settimana risulta che la stima del peso fetale sia quasi 3375 grammi, ed alla 20-esima circa -250 grammi (meno duecentocinquanta!). Mentre il primo valore sembra accettabile, il secondo non lo è di certo: possiamo addirittura sorridere sul fatto che una creatura dell’universo abbia massa negativa. In conclusione: è del tutto azzardato pretendere di estrapolare per mezzo di una regressione un valore “di molto” esterno all’intervallo considerato.
Il buon senso ci dice che non è possibile effet-tuare una regressione lineare o una esponenziale su tutto l’intervallo dei dati, visto che il fenomeno manifesta un tipico “comportamento logistico”. Un’idea potrebbe essere quella di cal-colare localmente una regressione esponenziale sull’intervallo da 1 a 6, una regressione lineare da 6 a 10, e una esponenziale da 10 a 15, a seconda del dato che interessa stimare. |
Si potrebbe utilizzare la formula: 2*INT(50*CASUALE()+1). Infatti,
INT(50*CASUALE()+1) genera numeri
casuali interi dall’uno al cinquanta. Quindi,
moltiplicandoli per 2, otteniamo dei numeri pari nel range da 2 a 100.
In pratica, una sequenza casuale del tipo: GAGATGCGCGAG… deve mutare, casualmente, ad esempio in GAGGTGCGCGAG… Vi sono molte strategie possibili. Ad esempio, nella colonna A abbiamo inserito una sequenza da 1 a 25. Siccome è semplice generare numeri casuali, ma non lettere casuali, abbiamo compilato la colonna C con la formula: =INT(4*CASUALE()) e nella colonna B abbiamo trasformato i numeri casuali in lettere con una serie di istruzioni SE nidificate: =SE(C6=0;"A";SE(C6=1;"C";SE(C6=2;"G";"T"))) |
Nella cella B2 abbiamo contato la lunghezza della sequenza in C, con la funzione:
=CONTA.VALORI(C6:C1000)
ed in base a questa lunghezza,
nella C3 abbiamo fatto scegliere a caso
la posizione in cui avverrà la mutazione: INT(CASUALE()*B2+1)
. La colonna D controlla la
posizione dove si debba effettuare la mutazione
casuale, sostituendo il valore della colonna C
con un artificioso 999:
=SE(A6=$C$3;"999";C6)
La colonna E ricopia i valori della colonna D, a meno che non vi sia quel 999, nel qual caso viene generato un nuovo numero casuale da 0 a 3: =SE(D6="999";INT(4*CASUALE());D6). Infine i numeri vengono ri-convertiti in lettere con lo stesso trucco di prima:
=SE(E6=0;"A";SE(E6=1;"C";SE(E6=2;"G";"T")))
Ricordiamo che è possibile “bloccare” la generazione dei numeri casuali come abbiamo visto a pagina 14.
La morale di questo esercizio? Come vedete, è stato “difficile” realizzarlo perché lo strumento (MS Excel) si è rivelato inadeguato; un po’ come voler aprire una scatoletta di tonno utilizzando un cacciavite ed un martello: si può fare, ma è faticoso. Problemi di questo tipo invece si risolvono senza fatica utilizzando i linguaggi di programmazione o software di sviluppo (si veda ad es [8]).
L’istogramma delle frequenze dovrebbe ap-parire simile a questo. Si può lanciare, nelle colonne da B ad F, i dadi come abbiamo già visto, eseguire nella colonna G la SOMMA de-gli esiti, riportare nella colonna H i possibili esiti, che vanno ovviamente da 5 a 30, ed infine contare quante volte sono apparsi i singoli esiti |
con
le funzioni: =CONTA.SE(G2:G102;H2) , =CONTA.SE(G2:G102;H3) , … , copiando ed
incollando la funzione.
Il fatto che la moneta sia simmetrica, e quindi il fatto che la probabilità di Testa o Croce siano equivalenti, comporta che i valori di probabilità siano simmetrici nel grafico rispetto al 5. Creiamo la sequenza da 0 a 10 nella prima riga, usiamo la funzione =DISTRIB.BINOM(A1;10;0,5;FALSO) nella cella A2 e poi la trasciniamo verso destra tenendo cliccata la maniglia di riempimento. |
Probabilmente il CUP è stato indotto a calcolare , interpretando in modo erroneo il significato di quella percentuale. Al CUP non vanno bene tutti e 22 gli anagrammi della parola SSSSSSSSSSSSSSSSSSSSSN, né la singola parola SSSSSSSSSSSSSSSSSSSSSS (S = si presenta, |
|||
N = non si presenta). Dunque abbiamo a che fare con la variabile aleatoria qui a fianco, e la probabilità P di ritrovarsi con uno o due pazienti inferociti è data da:
|
|
||
In pratica, si dovrebbe affrontare un caso di overbooking ogni tre giorni… |
|||
Per esempio, copiando mille volte la formula =INT(2*CASUALE()) nella colonna A, ricopiando il tutto nelle colonne B e C, facendo la SOMMA dei tre eventi in D, e con la funzione CONTA.SE verificando quante volte, su mille, è uscito il 2. Tale numero dovrebbe avvicinarsi a .
Come si vede, il 68,3% circa possiede una pressione compresa tra 13 e 19 mm Hg, e circa il 6,7% tra 12 e 13. Siccome la gaussiana è simmetrica rispetto al valor medio 16, anche nell’intervallo si colloca il 6,7% circa di popolazione. |
Il range varia da 69,4 Kg a 80,6 Kg circa. Possiamo infatti ragionare in questo modo: siccome il 90% cade nel range incognito, allora il rimanente 10% ne sta al di fuori, e data la simmetria della normale, ci aspettiamo che il 5% sia molto sottopeso (nella coda di sinistra), e il 5% molto sovrappeso (nella coda di destra). Quindi, essi si collocano tra il 5° ed il 95° percentile.
Assumendo per esempio e , l’esercizio 10 ci ha già mostrato che la differenza tra DISTRIB.NORM(19;16;3;VERO) e DISTRIB.NORM(13;16;3;VERO) è pari al 68,3%. E’ sufficiente ora calcolare DISTRIB.NORM nei quantili e per trovare
una differenza del 95,4% circa. Infine, pos-siamo usare INV.DISTRIB.NORM per veri-ficare le relazioni approssimate intercorrenti tra i quartili e ed i parametri e . |
Inserire nel quintetto un esperto trenta-quattrenne al posto del giovane play non modifica la mediana: la nuova media però si è allontanata dalla me-diana, a significare che la distribuzione delle età ha perso la caratteristica di “simmetria” attorno alla media. Un possibile quintetto come richiesto potrebbe essere 20, 20, 21, 21, 30. |
|
Si possono fare FATTORIALE(12) = 479.001.600 liste… non ve ne aspettavate così tante, vero?
Le parole possibili da UNO sono PERMUTAZIONE(3;2) = 6; infatti abbiamo: UO, UN, OU, ON, NU, NO; quelle possibili da ROMA sono PERMUTAZIONE(4;3) = 24.
Il problema è simile a quello di voler vedere quante sono le parole di sei lettere che si possono ottenere utilizzando un vocabolo di dodici lettere: PERMUTAZIONE(12;6) = 665.280
Poiché vi sono 4005 possibili ambi (sono le combinazioni di 90 oggetti di classe 2), la probabilità è pari a , ossia circa lo 0,025%. Si noti che l’ambo viene remunerato solamente 270 volte la posta, circa un quindicesimo di quanto sarebbe equo aspettarsi.