ritorna all'inizio

§2.2 La regressione dei dati (parte seconda)

 

            Nella pratica biomedica, molti fenomeni vengono analizzati effettuando una regressione lineare; sovente capita che questo venga fatto anche quando un semplice esame a prima vista del grafico suggerisce che il comportamente non è affatto “rettilineo”. Prendiamo in esame questi dati:

103; 108; 112; 116; 121; 124; 126; 127; 128; 128;

essi descrivono la pressione sistolica misurata su individui dell’età di 2, 4, 6, .. , 20 anni. Si chiede di effettuare la regressione lineare al fine di stimare la pressione sistolica all’età di 21 anni.

L’andamento grafico dei dati ci suggerisce immediatamente che la regressione lineare sovrastima la pressione sistolica, fornendo una risposta (133,6) che ovviamente è inattendibile.

Se invece impostiamo una regressione Polinomiale di ordine 2 (una “parabola”), otteniamo un valore più attendibile (128,1), che migliora ancor di più se ci limitiamo a considerare solo gli ultimi quattro valori pressori, tracciando il loro grafico, ed effettuando la regressione polinomiale del secondo ordine (128).

C’è da tenere presente che Excel consente di approssimare i dati con polinomi fino al sesto ordine.

            Ci sono poi fenomeni che per la loro stessa natura, vengono descritti da modelli matematici ben diversi da rette e polinomi; è il caso della crescita delle colture batteriche:

 

Problema introduttivo. Un tecnico di laboratorio esegue una coltura batterica, prendendo nota di ora in ora della quantità di microorganismi presenti nella caspula di Petri. Sfortunatamente, il dato relativo alla ottava ora di sviluppo non viene registrato. A partire dai dati rilevati, si può stimare in qualche modo il dato mancante?

 

La situazione visualizzata dal grafico lascia intendere immediatamente che la retta non è assolutamente un modello adeguato di regressione. Abbiamo dunque effettuato la regressione esponenziale, chiedendo come al solito di evidenziare l’equazione della curva di regressione e il coefficiente di correlazione.

Utilizzando perciò la funzione  possiamo stimare la presenza di circa 357 milioni di batteri presenti all’ottava ora, utilizzando la formula =0,8859*EXP(0,75*dato), essendo dato il nome che abbiamo attribuito alla cella A9.

A questo punto avremmo da fare delle pertinenti osservazioni matematiche, che temiamo però possano appesantire la lettura della dispensa; per questa ragione, le riportiamo in Appendice 3. Ci limitiamo solo ad osservare che spesso i fenomeni esponenziali sono difficili da rappresentare graficamente, visto che i dati “esplodono” in grandezza, ed allora può essere opportuno utilizzare una scala logaritmica.

Esercizio 3.

Un tecnico di laboratorio deve studiare un fenomeno di evoluzione caratterizzato da questi dati, rilevati ad intervalli di tempo equidistanti:

0,04 ; 0,08 ; 0,15 ; 0,29 ; 0,56 ; 1,00 ; 1,67 ; 2,50 ; 3,33 ; 4,00 ;

4,44 ; 4,71 ; 4,85 ; 4,92 ; 4,96 ; 4,98; 4,99 ; 5,00 ; 5,00 ; 5,00

Si realizzi un grafico, e si noti il comportamento qualitativo del grafico. Quale strategia si potrebbe seguire per realizzare una regressione di questi dati?