Introduzione all'inferenza statistica

34 downloads 368 Views 360KB Size Report
Statistica medica. 1. Inferenza statistica. L'inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di  ...
Inferenza statistica L’inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella popolazione. Il percorso dell’inferenza statistica si svolge secondo le seguenti fasi: 1. estrazione di un campione della popolazione 2.

calcolo

delle

statistiche

campionarie,

cioè

dei

valori

corrispondenti ai dati contenuti nel campione 3.

stima dei parametri nella popolazione in base ai risultati

forniti dal campione. Statistica medica

1

Popolazione: • insieme

che

raccoglie

tutte

le

osservazioni

possibili,

relativamente ad una data variabile o ad un dato fenomeno. • può essere finita (comunque molto grande) o infinita

Statistica medica

2

Campione:

• raccolta finita di elementi estratti da una popolazione • scopo dell’estrazione è quello di ottenere informazioni sulla popolazione • pertanto il campione deve essere rappresentativo della popolazione da cui viene estratto (‘non viziato’) • per corrispondere a queste esigenze il campione viene individuato con un campionamento casuale.

Statistica medica

3

In un campionamento casuale semplice tutti gli individui nella popolazione hanno uguale probabilità di essere inclusi nel campione.

- individui nella popolazione = "unità di campionamento" - popolazione oggetto dello studio = "popolazione bersaglio" - popolazione effettivamente campionabile (al netto dell'effetto di fattori di selezione) = "popolazione studio " o base di campionamento

Statistica medica

4

Statistica medica

5

• Una stima puntuale è un procedimento attraverso il quale a partire dalle informazioni tratte da un campione si ottiene come risultato un singolo valore numerico usato come stima del parametro dell’intera popolazione

Es: x = ( ∑ xi ) / n • Una stima intervallare è un procedimento attraverso il quale a partire dalle informazioni tratte da un campione si ha come risultato un insieme di valori che con un certo grado di fiducia conterrà il parametro da stimare

Statistica medica

6

Ø Campioni ripetuti dalla stessa popolazione forniscono medie campionarie diverse

Ø

Ciascuna di queste medie campionarie costituisce una stima non distorta del parametro (media della popolazione) ma non può essere usata come stima del parametro da sola, senza tenere conto dell’incertezza causata dall’errore campionario.

Statistica medica

7

- La media delle medie campionarie corrisponde alla media della popolazione (µ)

-

La variabilità della distribuzione delle medie campionarie è inferiore alla variabilità nella popolazione. Campioni più grandi daranno una distribuzione con variabilità inferiore.

-

La forma della distribuzione di frequenza delle medie campionarie è gaussiana o normale

Statistica medica

8

La forma della distribuzione normale È la distribuzione di probabilità che meglio rappresenta molte variabili biologiche

Statistica medica

9

Esempio: Quale sarà la probabilità di osservare un soggetto con una statura inferiore a m 1,5928 data una popolazione con altezza media 1,730 e deviazione standard 0,07 (distribuzione di partenza assunta come normale)?

x − µ z = σ z = (1,5928 - 1,730) / 0,07 = - 1,96 P(z 4,31 = 0,00036 Statistica medica

23

p-value = 0,00072 p < α quindi rifiuto l’ipotesi nulla µ = 34.5

Statistica medica

24

Il valore p è la probabilità di osservare sotto l’ipotesi nulla un valore della statistica test maggiore o uguale (nel verso appropriato) di quello realmente calcolato. Se il valore di p è minore o uguale ad a allora rifiutiamo l’ipotesi nulla; se invece il valore di p è maggiore di a non rifiutiamo l’ipotesi nulla.

Statistica medica

25

Esercizio:

1.Ipotizzo in base a dati di laboratorio che il fumo di tabacco aumenti i valori pressori nei forti fumatori (H1) 2. H0: 'i forti fumatori hanno la stessa pressione media della popolazione'. 3. Fisso l'errore α al 5%; sono interessato ad eventuali scostamenti in entrambe le direzioni (test di ipotesi bilaterale o 'a 2 code') 4. Programmo uno studio in cui viene misurata la pressione arteriosa sistolica a 36 soggetti.

Statistica medica

26

5. La variabile 'pressione arteriosa' nella popolazione ha distribuzione gaussiana. Il valore medio nella popolazione è 165. Non conosco il

valore della deviazione standard nella

popolazione.

6.

Il test statistico è il test t di student.

7. Conduco lo studio ed ottengo i seguenti risultati. Media = 172,8 Deviazione standard= 24,25 L’errore standard sarà quindi = 4,04 Statistica medica

27

8a Calcolo del test t = (Media campione – media popolazione) / Errore standard = (172,8 – 165) / 4,04 = 7,8 / 4,04 = 1,93

La probabilità che il campione sia stato estratto da una popolazione con media pari a 165 mmHg è compresa tra 0,05 e 0,10. Non escludo pertanto l’ipotesi nulla che il campione sia stato estratto da una popolazione con tale media.

Statistica medica

28