Test di verifica possibilità per lo studente di verificare la ... (soluzioni alla fine del
libro). • Esercizi interamente svolti sul sito web www.ateneonline.it/borra2e. 6 ...
Corso di Statistica canale P - Z Prof.ssa Paola GIACOMELLO
[email protected] Sito con materiale corso www.dte.uniroma1.it Orario ricevimento: Giovedì ore 9,00-11,30 stanza n.8 Dip. Analisi Economiche e Sociali (I piano facoltà) Lezione: Lun Mar Mar Giov
17,30-19.00 aula B 13.00-14.30 aula B 14.30-16.00 aula B(esercitazioni) 11,30-13,00 aula A
1
Perché è importante la Metodologia statistica Con l’avvento dei computer, di internet e della globalizzazione economica, si deve osservare che l’informazione quantitativa è fortemente aumentata ed è entrata prepotentemente nelle case di tutti. Leggere, scrivere e far di conto sono fondamentali e indispensabili ma non sono più sufficienti per stare al passo con le società moderne dell’economia e dell’informazione globale. Sono necessari nuovi livelli di conoscenze e tra questi è vitale un nuovo sapere: leggere ed interpretare e sintetizzare la realtà e l’informazione quantitativa che ci circonda. Ciò si acquisisce mediante lo studio degli strumenti di base della Statistica, che, in questo momento più di altri possono contribuire a far crescere il nostro capitale umano. M. Vichi Presidente Società Italiana di Statistica http://www.sisstatistica.it/
2
La metodologia statistica ci permette di : 1. analizzare grandi quantità di dati al fine di stabilire i comportamenti abituali dei soggetti che stiamo analizzando; 2. Ricercare le cause del manifestarsi di molti fenomeni; 3. cercare di evidenziare i legami che possono esistere tra più fenomeni; 4. prendere decisioni, in diversi ambiti, riducendo gli errori che si commettono poiché non ci si basa su opinioni personali (metodi soggettivi), ma si utilizzano metodi oggettivi. 3
Da dove nasce il termine STATISTICA ?
• Etimologia del termine statistica deriva dal vocabolo italiano “stato”e fa riferimento al fatto che le prime informazioni su fenomeni reali sono state raccolte ed organizzate da organismi statali che ne erano anche i principali utilizzatori. • Sembra che il termine sia stato introdotto per la prima volta nel 1589 dal Ghislini e successivamente in Germania da Conring che istituì un corso universitario di “scienza politica” con l’obiettivo di descrivere le “cose notevoli dello Stato” 4
STATISTICA = Scienza descrittiva dello Stato come può non esserci un esame di statistica nei corsi di laurea proposti dalla Facoltà di Scienze Politiche?
5
Specificazioni sul testo adottato S.Borra, A. Di Ciaccio, Statistica, II ed., McGraw-Hill, 2008 • Organizzato attorno a sommario (subito dopo il titolo del capitolo), definizioni (evidenziate con sfondo colorato), proprietà matematiche (all’interno di appositi riquadri), esempi (importantissimi per capire le possibili applicazioni concrete di ciò che si studia), note (scritte in corpo minore con approfondimenti) e Appendici (dimostrazione matematica dettagliata) • Test di verifica possibilità per lo studente di verificare la comprensione degli argomenti trattati nel capitolo (soluzioni alla fine del libro) • Esercizi interamente svolti sul sito web www.ateneonline.it/borra2e 6
Oggi la metodologia statistica(ms) è fondamentale sia nelle scienze sperimentali sia in quelle osservazionali La ricerca scientifica procede secondo le fasi di: 1.Osservazione preliminare del fenomeno e formulazione di domande su un determinato comportamento; 2.Formulazione di un’ipotesi su tale comportamento; 3.Programmazione e realizzazione dell’attività di acquisizione dei dati empirici relativi al comportamento studiato; 4.Verifica dell’ipotesi Soprattutto nelle fasi 3 e 4 la ms interviene 7
e nella realtà quotidiana? “cosa fate quando dovete acquistare un pc?” • che utilizzo farò del nuovo pc? • Sulla base della risposta decidete che caratteristiche deve avere il nuovo pc • Andate su internet, confrontate le caratteristiche dei vari modelli, confrontate i prezzi a cui vengono venduti (acquisizione di dati empirici) • Comperate il pc, lo usate e verificate se soddisfa i vostri bisogni (verifica d’ipotesi)
Probabilmente quotidianamente applichiamo il metodo statistico senza esserne consapevoli 8
Pensiero statistico è: Logico Utilizza i dati Riconosce l’interdipendenza delle azioni Tiene conto delle variazioni
Ne segue che dobbiamo cercare sempre di: Utilizzare i dati per guidare l’analisi Cercare le associazioni e le relazioni Capire perché i dati osservati si differenziano gli uni dagli altri
9
Che cosa è la Statistica La Statistica può essere definita come un insieme di tecniche che hanno come scopo la conoscenza quantitativa dei fenomeni collettivi Operazioni tipiche delle analisi statistiche sono: il conteggio la classificazione la misurazione la sintesi tramite modelli esplicativi dei fenomeni reali
10
STATISTICHESE La popolazione o collettivo statistico è l’insieme di individui o oggetti che si vogliono studiare. Questi individui o oggetti vengono denominati unità statistiche. • Un campione è una parte di popolazione. • Un censimento è lo studio dell’intera popolazione. Campione Rilevazione parziale
Popolazione Rilevazione totale
11
Carattere è l’aspetto che si intende studiare su un determinato collettivo statistico Modalità del carattere i diversi modi con cui il carattere si presenta nelle varie unità statistiche del collettivo. Devono essere esaustive e non sovrapposte I caratteri si dividono in: – Qualitativi danno luogo a risposte non numeriche. Es: qual è il vostro stato civile? MUTABILI – Quantitativi danno luogo a risposte numeriche. VARIABILI Continui: le risposte derivano da un processo di misurazione. Es: quanto siete alti? Discreti: le risposte derivano da un processo di conteggio. Es: quanti fratelli o sorelle avete? Quantitativi
trasferibile (pacchetto azionario, reddito…) non trasferibile (età, statura…)
12
Caratteri qualitativi • Dati nominali quando le diverse categorie possono essere messe in un ordine qualsiasi (es. sesso M prima di F o viceversa) Caratteri sconnessi come posso trattare statisticamente tali caratteri? Ad esempio associando a M il valore 0 e a F il valore 1 così potrò fare delle operazioni) • Dati ordinali quando le diverse categorie hanno un ordine di assegnazione che ha un significato (es.livello d’istruzione nessun titolo; licenza elem; licenza media inf; licenza media sup; laurea; anche qui potrei associare i valori da 0 a 5 oppure valori che corrispondano al numero di anni necessari per conseguire il titolo) Caratteri rettilinei 13
Carattere quantitativo • Discreto le modalità sono rappresentate da numeri, risultano da un conteggio es. abitazioni secondo il numero dei vani 1,2,3,4… (scala proporzionale) • Continuo le modalità risultano da un confronto con un’unità di misura. Spesso le modalità proprio per la loro continuità vengono raggruppate in classi es. statura 150-160; 160170; 170-180…. n. di classi adeguato al problema classi disgiunte includere tutte le modalità del carattere abbiano se possibile stessa ampiezza intervalli aperti a destra o a sinistra 14
Come avviene l’acquisizione dei dati? • Rilevazione sperimentale tipica delle Scienze fisiche, biologiche, chimiche etc. • Rilevazione osservazionale tipiche delle indagini statistiche, delle indagini di mercato, delle rilevazioni economiche, demografiche, sociali, etc.
15
Qual è in Italia l’Ente preposto all’acquisizione dei dati tramite indagini statistiche? ISTAT (Istituto Nazionale di Statistica) •
Istat è un Ente di diritto pubblico con coordinamento autonomo, sottoposto alla vigilanza della Presidenza del Consiglio (attuale Presidente Enrico Giovannini)
•
Istat è al vertice del Sistema Statistico Nazionale (Sistan) che comprende oltre all’Istat, gli uffici di statistica centrali e periferici delle amministrazioni dello Stato, quelli delle Regioni, delle Province e dei Comuni, delle Unità Sanitarie Locali, delle Camere di Commercio e tutti gli uffici di statistica di enti e amministrazioni pubbliche http://www.istat.it/ 16
Fasi dell’indagine definizione degli obiettivi definizione delle unità e delle variabili da rilevare scelta del periodo di riferimento
individuazione della popolazione e della lista delle unità statistiche definizione del piano di campionamento raccolta dei dati scelta della tecnica di rilevazione formulazione del questionario e pretest rilevazione sul campo
registrazione dei dati registrazione su supporto magnetico controllo e correzione
elaborazione e analisi dei dati 17
Un esempio Si vogliono studiare le caratteristiche demografiche e sociali (caratteri) della popolazione del Lazio al 1° gennaio 2010 (collettivo). Un questionario potrebbe raccogliere le seguenti informazioni
Dati estratti dal questionario della terza intervista Codice ident. intervista
3
Sesso
M
Età in anni compiuti
38
Stato civile Coniugato Provincia di residenza
LT
Titolo di studio Laurea Professione Impiegato Numero componenti della famiglia (oltre l’intervistato)
4
Reddito lordo annuo (in migliaia di euro)
40 18
Tabella dei dati Cod. I nt.
Sesso
1 2
F F
3
Età in anni compiu ti
Stato Provincia Titolo Professione n. Reddito civile di resid. di comp. lordo annuo studio Fam. ( migl. Euro)
29 40
Nu b ile Nu b ile
RM FR
1 3
3500 0 1000 0
LT
Lau rea I m p ieg at o Dip lom Disoccu p at o a Lau rea I m p ieg at o
M
38
4
F
42
Con iu g at o Con iu g at a
4
4000 0
FR
Lau rea
3
9000 0
5
M
48
Celib e
RI
1
9000 0
6
M
59
RM
7
M
70
Con iu g at a Celib e
4
1500 0
5
3000 0
8 9
F F
25 35
Nu b ile Con iu g at a
FR FR
3 3
2000 0 5000 0
10
M
46
Celib e
RM
2
7000 0
RM
Lib ero p rofession is t a Lau rea Lib ero p rofession is t a Dip lom Casalin g a a Lic. Pen sion at o Med ia Lau rea Disoccu p at o Lau rea Lib ero p rofession is t a Lau rea Pen sion at o
19
Qualche osservazione La stessa modalità può presentarsi ripetuta – anche molte volte – nella stessa colonna Ogni colonna corrisponde alla distribuzione unitaria di un carattere Scelto un carattere tra quelli di interesse, dalla tabella è possibile individuare subito la modalità assunta da ogni unità statistica del collettivo. Viceversa, scelta un’unità, è possibile leggere le modalità che questa unità presenta in corrispondenza di ogni carattere considerato (lettura per riga). 20