Aiuto allo studio in STATISTICA per medie e superiori: mix di esercizi miei e di attinti da varie fonti

Scusa la banalità di questa bozza di appunti.

Potresti trovare utili links in web, ad es.: studenti, youmath, ...

Potresti digitare in Google differenza tra media, mediana, moda

[Pagina senza pretese di esaustività o imparzialità, modificata 01/05/2020; col colore grigio distinguo i miei commenti rispetto al testo attinto da altri]

Pagine correlate: matematica x medie e sup; calcolo combinatorio

 

Distribuzione statistica di dati

(in ordinata le frequenze di ricorrenza dei dati indicati in ascissa)

La MEDIA è il rapporto tra la somma dei dati numerici messi in ascissa e il numero dei dati

La MODA è il valore che si presenta con maggiore frequenza

La MEDIANA è il valore centrale tra i dati numerici espressi in ascissa in ordine crescente

 

 

2019.05.02 i 23 alunni (A, B ... Z) di una classe indicano quanti minuti impiegano solitamente per raggiungere la scuola: A 20, B 12, C 3, D 7, E 5, F 6, G 15, H 5, I 10, L 4, M 7, N 5, O 6, P 9, Q 5, R 6, S 7, T 10, U 7, V 10, X 18, Y 2, Z 5

Per calcolare la MEDIA dei tempi basta fare la somma dei tempi e dividere per 23

   MEDIA μ=184/23=8

 

Per calcolare la MEDIANA (detta anche mediana campionaria) dei tempi è necessario disporre in ordine crescente i 23 valori che indicano i tempi di percorrenza

Y          2

C         3

L          4

E          5

H         5

N         5

Q         5

Z          5

F          6

O         6

R         6

D         7

M         7

S          7

U         7

P          9

I           10

T          10

V          10

B          12

G         15

X          18

A          20

e quindi individuare il valore centrale che è alla 12ª posizione, il valore 7

Se la sequenza avesse avuto un numero pari di elementi, anziché dispari, avremmo considerato i due valori centrali e avremmo preso per MEDIANA la media tra loro due.

 

Per calcolare la MODA (detta anche moda campionaria) dei tempi è necessario costruire la distribuzione di frequenza dei tempi, ossia associare ad ogni valore del tempo la sua frequenza assoluta, come in tabella

val        frequenza di ricorrenza

2           1

3           1

4           1

5           5

6           3

7           4

9           1

10         3

12         1

15         1

18         1

20         1

23

Si vede che il valore più frequente è il 5.

 

Per calcolare la VARIANZA (detta anche media ponderata degli scarti quadratici) è necessario affiancare alla suddetta tabella delle frequenze gli scarti di ogni valore rispetto alla media, farne i quadrati, e farne la media ponderata sulle frequenze

valore
x

frequenza

scarto
(x-μ)

scarto²

scarto²
* freq

2

1

-6

36

36

3

1

-5

25

25

4

1

-4

16

16

5

5

-3

9

45

6

3

-2

4

12

7

4

-1

1

4

9

1

1

1

1

10

3

2

4

12

12

1

4

16

16

15

1

7

49

49

18

1

10

100

100

20

1

12

144

144

23

460

VARIANZA = media ponderata degli scarti quadratici =  460/23=20,00

 

2019.05.02 in 2000 casse di cuscinetti se ne trovano di guasti, con la seguente casistica: in 340 casse i cuscinetti sono tutti buoni, in 360 casse si trova un cuscinetto guasto per ciascuna, in 500 casse se ne trovano 2 di guasti per ciascuna, in 400 casse 3 guasti/u, in 200 casse 4 guasti/u, il 160 casse 5 guasti/u, e in 40 casse 6 guasti ciascuna; calcolare MEDIA, MEDIANA, MODA, VARIANZA

Soluzione:

ci è stata indicata la casistica in ordine crescente di numero guasti trovati in ogni scatola (se ci avessero fornito i dati in ordine casuale, avremmo dovuto primariamente costruire la tabella in ordine crescente di valori, come segue)

 

x
(classe)

freq.
assoluta

freq.
Relativa

x
 * freq

x - media
(scarto)

scarto²

scarto²
* freq

0

340

17,0%

0

-2,2

4,84

1.645,60

1

360

18,0%

360

-1,2

1,44

518,40

2

500

25,0%

1.000

-0,2

0,04

20,00

3

400

20,0%

1.200

0,8

0,64

256,00

4

200

10,0%

800

1,8

3,24

648,00

5

160

8,0%

800

2,8

7,84

1.254,40

6

40

2,0%

240

3,8

14,44

577,60

2.000

100,0%

4.400

4.920,00

Per calcolare la MEDIA dei guasti per scatola basta fare la media ponderata sulle frequenze, cioè MEDIA μ=(0·340+1·3601+...+6·40)/2000=4400/2000=2,2 cuscinetti guasti per scatola

La MODA è il valore più frequente:  2 cuscinetti guasti per cassa (ricorre con freq.500, la massima)

La MEDIANA è il valore centrale tra i dati numerici messi in ordine crescente: la lista è pari e dunque i valori centrali sono 2, a posizione 1000 e a posizione 1001: fino al posto 340 troviamo 0; da 341 a 700 troviamo 1; da 701 a 1200 troviamo 2; quindi la MEDIANA è 2

La VARIANZA = media ponderata degli scarti quadratici =  4920/2000 = 2,46

La DEVIAZIONE STANDRD = radice quadrata della varianza = 1,57