Occorre innanzitutto scegliere il numero delle classi, tra 5 e 7. Si scelga per esempio un numero di classi pari a 5 (ma è corretto anche scegliere un numero diverso di classi!).
Per determinare l’ampiezza di ciascuna classe, occorre applicare la formula: \[ w= \frac{\mathrm{Massimo}-\mathrm{Minimo}}{\mathrm{N. Classi}} = (65-12)/5 = 53/5 =10.6 \] È importante arrotondare sempre per eccesso l’ampiezza determinata con la formula (in questo caso 11).
Le classi saranno dunque:
[12;23) [23;34) [34;45) [45;56) [56;67)
La distribuzione di frequenze richiesta è:
\[ \begin{array}{crr} \text{Classi} & \text{Frequenze} & \text{F. Relative} \%\\ \hline 12\vdash 23 &6 & 21 \\ 23\vdash 34 &3 &11 \\ 34\vdash 45 &10 & 36 \\ 45\vdash 56 &2 & 7\\ 56\vdash 67 &7 & 25\\ \hline & 28& 100 \\ \end{array} \]
\[ \bar x = \frac{20+73+ 75 +80+82}{5} = 66 \]
Posizione centrale nella successione ordinata = (5+1)/3 = 3. Mediana = 75.
La moda non riusciamo a calcolarla perché tutte le modalità hanno frequenza uguale.
Delle tre misure di sintesi, quella che descrive meglio i dati è la mediana, poiché esiste un dato anomalo che sposta la media eccessivamente verso il basso.
La media è \(\bar x = 20.74\). Per la mediana prima ordino i dati
10.2 13.1 15.0 15.8 16.9 17.3 18.2 24.7 25.3 28.4 29.3 34.7
Quindi trovo la posizione centrale in questa graduatoria. Poiché il numero di unità è pari, ci sono due posizioni centrali. Le trovo calcolando \((n+1)/2 = (12 + 1)/2 = 6.5\). Quindi le posizioni sono la 6 e la 7. La mediana è la semisomma del sesto e del settimo valore in graduatoria. Quindi Mediana = \((17.3 + 18.2)/2 = 17.75.\)
Il coefficiente di variazione è il rapporto tra deviazione standard e il valore assoluto della media. Occorre dunque anzitutto calcolare queste misure di sintesi. La media è \(\bar x = 9\). La deviazione standard è (sono dati campionari e quindi si usa il denominatore \((n-1)\)) \[ s = \sqrt{\frac{10}{4}} = 1.5811. \] Perciò il coefficiente di variazione è \[ \frac{s}{|\bar x|} = 1.5811/9 = 0.1757 = 17.57\%. \]
Il numero di osservazioni è \(n = 24\). La successione in ordine crescente è
12, 13, 13, 13, 14, 16, 20, 20, 23, 25, 26, 27, 27, 28, 29, 35, 37, 37, 40, 40, 40, 45, 49, 66
La media è \(\bar x = 28.9583\) secondi.
La deviazione standard è \(s = 13.5694\) secondi.
Il minimo e il massimo sono 12 e 66. La mediana è la semisomma delle osservazioni al 12mo e 13mo posto. Siccome sono entrambi uguali a 27 la mediana è 27. I quartili si possono calcolare analogamente con una formula spiegata sul libro. Siccome non è in programma non mi soffermo sui dettagli.
Il coefficiente di variazione (non confondete con il campo di variazione!) è \[ CV = \frac{s}{|\bar x|} = 13.5694/28.9583 = 46.86\%. \]
I dati rono raggruppati in classi. Quindi si calcolano i valori approssimati di media e varianza definendo i punti centrali di classe \(c_i\) e risulta \(\bar x = \sum_i c_i n_i /n = 505/40.\) La tabella seguente è utile per fare i calcoli della varianza
\[ \begin{array}{crrrrrr} \text{Classi} & \text{Freq} & c_i & \text{Freq} \times c_i & c_i - \bar{x} & (c_i - \bar{x})^2 & (c_i - \bar{x})^2 n_i \\ \hline 0-4 & 5 & 2 & 10 & -10.625 & 112.891 & 564.4531 \\ 5-9 & 8 & 7 & 56 & -5.625 & 31.641 & 253.1250\\ 10-14 & 11 & 12 & 132 & -0.625 & 0.391 & 4.2969\\ 15-19 & 9 & 17 & 153 & 4.375 & 19.141 & 172.2656\\ 20-24 & 7 & 22 & 154 & 9.375 & 87.891 & 615.2344\\ \hline & 40 & & 505 & & & 1609.3750\\ \end{array} \] La varianza si calcola come
\[ \sum_i (c_i - \bar x)^2n_i/n = 1609.375/39 = 41.2661 \] dove abbiamo usato il denominatore \(n-1\). La deviazione standard è 6.42.
Poiché i dati sono campionari si calcola la varianza corretta \[ s^2 = \sigma^2 \frac{N}{N-1}. \]
Quindi in questo caso è \(s^2 = 3 \frac{50}{49} = 3.061\) e la deviazione standard è \(s = \sqrt{3.061} = 1.75\).
x: 5, 21, 14, 11, 9, 4, 7, 21, 17, 14, 9, 7, 9, 21, 13, 14, 9, 4
y: 53, 65, 48, 66, 46, 56, 53, 57, 49, 66, 54, 56, 53, 52, 49, 56, 59, 56
Quindi
\(\bar x = 11.61, \bar y = 55.22\).
Il prodotto degli scarti \((x_i - \bar x)(y_i - \bar y)\) è
14.69, 91.80, -17.25, -6.59, 24.08, -5.92, 10.25, 16.69, -33.53, 25.75, 3.19, -3.59, 5.80, -30.25, -8.64, 1.86, -9.86, -5.92
La covarianza è (con denominatore \(N\)) \[ \sum_i [(x_i - \bar x)(y_i - \bar y)]/18 = 72.55/18 = 4.03. \]
Varianza di \(X\): Quadrati degli scarti \((x_i-\bar x)^2\):
43.71, 88.15, 5.71, 0.37, 6.82, 57.93, 21.26, 88.15, 29.04, 5.71, 6.82, 21.26, 6.82, 88.15, 1.93, 5.71, 6.82, 57.93
Quindi \[ \sum_i (x_i - \bar x)^2 = 544.28 \] e la varianza di \(y\) è \(542.28/18 = 30.12\) (sempre con denominatore \(N\)).
Analogamente si ottiene la \(\sigma^2_Y = 32.73\).
Quindi il coefficiente di correlazione è \[ \rho_{xy} = 4.03/\sqrt{30.12 \times 32.73} = 0.128. \]
L’associazione tra la dose del farmaco e la guarigione è debole. Quindi supponendo che i farmaco sia sempre potenzialmente dannoso si potrebbe pensare di prescrivere un dosaggio zero!
Quindi l’unione dei due è l’evento che ci vogliano 1,2,3,4,5 giorni cioè < 6 giorni. Questa è la esattamente la definizione dell’evento \(B\).
1. M1M2 5. M2M1 9. M3M1 13. T1M1 17. T2M1
2. M1M3 6. M2M3 10. M3M2 14. T1M2 18. T2M2
3. M1T1 7. M2T1 11. M3T1 15. T1M3 19. T2M3
4. M1T2 8. M2T2 12. M3T2 16. T1T2 20. T2T1
Ci sono cioè 20 eventi elementari che abbiamo numerato. Non sono 25 perché non possono capitare T1T1, T2T2, ecc.
\[ A = \{3,4,7,8,11, 12, 13, 14, 15, 16, 17, 18, 19, 20\} \]
\[ B = \{1,2,5,6,9,10,16,20\} \]
\[ \bar A = \{1,2,5,6,9,10\} \]
Invece \(\bar A \cap B = \{1,2,5,6,9,10\}\). Quindi la loro unione è \(B\).
\[ \{3,4,7,8,11,12,13,14,15,16,17,18,19,20,1,2,5,6,9,10\} \]
cioè eliminando i doppioni
\[ \{1,2,3,4,5,6,7,8,9,10,11,13,14,15,16,17,18,19,20\} \]
ossia tutti gli eventi elementari. Questa coincide con \(A \cup B\).
NOIOSISSIMO!
Lo spazio campionario è AAAAABBBBBBB
. L’evento che un sottoinsieme di 2 lettere contenga una A e una B è \(\{A,B\}\). I casi possibili sono \[
\binom{5}{1}\binom{7}{1} = 35.
\] Cioè posso scegliere la A in 5 modi possibili e per ciascuna posso scegliere la B in 7 modi possibili. Ricordate l’esercizio in cui bisognava pescare a caso un comitato di maschi e femmine. Lo spazio campionario contiene \[
\binom{12}{2} = (12)(11)/2 = 66
\] casi possibili. Quindi la probablità è \(35/66 = 0.53\).
Per visualizzare il tutto potete costruire gli eventi elementari con una tabella:
| A A A A A B B B B B B B
--+-----------------------------------
A |AA AA AA AA AA AB AB AB AB AB AB AB
A | AA AA AA AA AB AB AB AB AB AB AB
A | AA AA AA AB AB AB AB AB AB AB
A | AA AA AB AB AB AB AB AB AB
A | AA AB AB AB AB AB AB AB
B | BB BB BB BB BB BB BB
B | BB BB BB BB BB BB
B | BB BB BB BB BB
B | BB BB BB BB
B | BB BB BB
B | BB BB
B | BB
Da dove vedete che gli AB sono 35 e tutti i casi possibili sono 66.
È più difficile del precedente, ma si usa la stessa regola. Lo spazio campionario è AAAAAABBBB
.
I casi possibili sono \[ \binom{10}{3} = (10\cdot 9\cdot 8)/(3 \cdot 2) = 120. \] I casi favorevoli sono (usando la regola di prima) \[ \binom{6}{1} \binom{4}{2} = 6 \cdot (4 \cdot 3)/2 = 36. \] Quindi la probabilità è \(36/120 = 0.3\).
Stesso sistema: l’insieme dei casi possibili è \(\binom{16}{4} = 1820\). Casi favorevoli: \(\binom{10}{2} \binom{6}{2} = 675\). Quindi la probabilità è \(675/1820 = 0.37\).
Questo è facile: la probabilità è uguale alla frequenza relativa di norvegesi \(= 20000/120000 = 1/6\).
Nota che alla seconda estrazione la popolazione è praticamente uguale.
\(P(A) = P(10\% - 20\% \cup > 20 \%) = 0.33 + 0.21 = 0.54.\)
\(P(B) = P(< –10\% \cup -10\% - 0\%) = 0.04 + 0.14 = 0.18.\)
\(\bar A\) è l’evento che il rendimento non sia maggiore del \(10\%\).
\(P(\bar A) = 0.04 + 0.14 + 0.28 = 0.46\)
L’intersezione tra più del 10% e rendimento negativo è l’evento impossibile.
\(P(A \cap B) = 0\).
L’unione di \(A\) e \(B\) è l’evento che il rendimento sia meno di –10%, da -10% a 0%, da 0% a 10%, da 10% a 20% e più del 20%.
\(P(A \cup B) = P(A) + P(B) - P(A\cap B) = 0.54 + 0.18 – 0 = 0.72.\)
\(A\) e \(B\) sono mutuamente esclusivi perché l’intersezione è vuota.
\(A\) e \(B\) non sono collettivamente esaustivi perché la probabilità della loro unione non è 1.
La concorrente ha in mente 3 diversi tipi di confezione E, S, L tutti ugualmente possibili. Traduzione: \(P(E) = P(S) = P(L) = 1/3\).
Tre strategie di marketing tutte ugualmente possibili. Traduzione: \(P(I) = P(II) = P(III) = 1/3\).
Si suppone che le scelte sul tipo di confezione e sulle strategie siano indipendenti.Traduzione: tutte le coppie di eventi \((E, I) , (E, II), (E, III), (S, I), (S, II), (S, III), (L, I), (L, II), (L, III)\) sono indipendenti. La domanda riguarda la probabilità \[ P(L \cap I) = ? \] La risposta si ottiene usando la regola del prodotto con eventi indipendenti: \(P(L \cap I) = P(L)P(I) = (1/3) (1/3) = 1/9.\)
Quanti sono i modi di permutare i 6 titoli? Sono \(6! = 720\). Ora supponiamo che i primi tre titoli siano A,B,C. Il numero di 6-uple che hanno i primi tre titoli uguali ad A,B,C sono formate fissando A,B,C e permutando i rimanenti 3 titoli. Il numero di queste sono \(3! = 6\).
Quindi la probabilità cercata è \(6/720 = 1/120 = 0.00833.\)
Avete lo stesso problema. Comitato: DDDDLL
In quanto modi possibili posso costruire un sottoinsieme di 3? In \(\binom{6}{3}\) modi = 20 modi. (Provare per credere).
Quanti sono i sottoinsiemi di 3 membri senza laureati? Sono \(\binom{4}{3} = 4\).
Quindi la probabilità è \(4/20 = 0.2\).
I possibili sottoinsiemi di 3 partecipanti presi da 5 sono le combinazioni di 5 oggetti di classe 3: \[ \binom{5}{3} = (5\cdot 4\cdot 3)/(3\cdot 2) = 10 \] Eccole: \[ \{1, 2, 3\}, \{1, 2, 4\}, \{1, 2, 5\}, \{1, 3, 4\}, \{1, 3, 5\}, \{1, 4, 5\}, \{2, 3,4\}, \{2, 3, 5\}, \{2, 4, 5\}, \{3, 4, 5\} \] Tuttavia ognuna di queste terne si può permutare in tutti i modi. Per esempio se il podio è \(\{1,2,3\}\), si possono avere le coppie ordinate \((1,2,3), (1,3,2) , (2,3,1), (3,2,1)\) etc.
Le permutazioni dei membri della terna sono \(3! = 3\cdot 2 = 6\). Quindi il numero totale di podi è \(10 \cdot 6 = 60\).
Li elenco qui sotto per chiarezza: \begin{align*} &\{1, 2, 3\}, \{1, 2, 4\}, \{1, 2, 5\}, \{1, 3, 2\}, \{1, 3, 4\}, \{1, 3, 5\}, \\ &\{1, 4, 2\}, \{1, 4, 3\}, \{1, 4, 5\}, \{1, 5, 2\}, \{1, 5, 3\}, \{1, 5, 4\},\\ &\{2, 1, 3\}, \{2, 1,4\}, \{2, 1, 5\}, \{2, 3, 1\}, \{2, 3, 4\}, \{2, 3, 5\},\\ &\{2, 4, 1\}, \{2, 4, 3\}, \{2, 4, 5\}, \{2, 5, 1\}, \{2, 5, 3\}, \{2, 5, 4\},\\ &\{3, 1, 2\}, \{3, 1, 4\}, \{3, 1, 5\}, \{3, 2, 1\}, \{3, 2, 4\}, \{3, 2, 5\},\\ &\{3, 4, 1\}, \{3, 4, 2\}, \{3, 4, 5\}, \{3, 5, 1\}, \{3, 5, 2\}, \{3, 5, 4\},\\ &\{4, 1, 2\}, \{4, 1, 3\}, \{4, 1, 5\}, \{4, 2, 1\}, \{4, 2,3 \}, \{4, 2, 5\},\\ &\{4, 3, 1\}, \{4, 3, 2\}, \{4, 3, 5\}, \{4, 5, 1\}, \{4, 5, 2\}, \{4, 5, 3\},\\ &\{5, 1, 2\}, \{5, 1, 3\}, \{5, 1, 4\}, \{5, 2, 1\}, \{5, 2, 3\}, \{5, 2, 4\},\\ &\{5, 3, 1\}, \{5, 3, 2\}, \{5, 3, 4\}, \{5, 4, 1\}, \{5, 4, 2\}, \{5, 4, 3\} \end{align*}Quindi se si tira a caso la probabilità di pescare quella vincente è 1/60.
\(\binom{5}{2} \binom{6}{4} = 150\).
Popolazione
MMMMM mmmmmm
I casi possibili sono 150. Mettiamo i due fratelli nella squadra:Mm
. Quindi la popolazione diventa
MMMM mmmmm
e i casi favorevoli sono il numero di modi con cui si può formare il resto della squadra: \[ \binom{4}{1}\binom{5}{3} = 40. \] La probabilità = \(40/150 = 0.27\).
Ci sono 6 fondi USA e 4 fondi INT.
Quindi \(AB = 15 \times 6 = 90.\)
Sia \(E\) = Nessun fondo USA dei 2 scelti e nessun fondo INT dei 2 scelti indipendentemente va male = \(C \cap D\).
Siccome sono indipendenti \[ P(E) = (10/15)(3/6) = 1/3. \]
Quindi ora si consideri che l’evento di cui si chiede la probabilità cioè \(F\) = almeno uno dei fondi scelti vada male = complementare di \(E\) avremo \[ P(F) = 1 - P(E) = 1 - 1/3 = 2/3. \]
\(A=\) preoccupato per il lavoro; \(B=\) preoccupato per i voti. \(P(A) = 0.3\), \(P(B) = 0.25.\) Inoltre \(P(A \cap B) = 0.2.\)
La probabilità chiesta è \[ P(A \cup B) = P(A) + P(B) - P(A \cap B) = 0.3 + 0.25 - 0.2=0.35. \]
Si deve calcolare la probabilità che si verifichi almeno uno degli inconvenienti A, B, C. Questo vuol dire \(P(A \cup B \cup B)\). Sappiamo che A e B sono indipendenti e quindi \(P(A \cap B) = P(A)P(B)\) e anche che A e C sono indipendenti. Perciò \(P(A \cap C) = P(A)P[C] \). Inoltre B e C si escludono a vicenda e quindi \(P(A \cup B) = P(A) + P(B)\).
Il disegno seguente dovrebbe essere utile.
 La probabilità cercata perciò è \[ \begin{aligned} P(A \cup B \cup C) &= P(B) + P[C] + P(A) - P(A\cap B) - P(A\cap C) \\ &= 0.02 + 0.01 + 0.04 - 0.02 \times 0.01 - 0.02 \times 0.04 = 0.069. \end{aligned} \] Guardate il disegno! Quando sommo \(P(A)\) conto due volte le probabilità delle intersezioni. Per questo occorre sottrarle.
ESERCIZIO DIFFICILE.
Sia \(A\) l’evento che il problema capita il lunedì. Sia \(B\) l’evento che il problema succeda durante l’ultima ora. Quindi \(P(A) = 0.3\) e \(P(B) = 0.2\). Inoltre siccome il 4% dei problemi avviene di lunedì e all’ultima ora vuol dire che \(P(A \cap B ) = 0.04\).
Chiede la probabilità che sapendo che un problema si verifica di lunedì questo NON si verifichi alla fine del turno, cioè \[ P(\bar B |A) = \frac{P(\bar B \cap A)}{P(A)} \] Il numeratore è la probabilità della differenza tra gli eventi \(A\) e \(B\). Questa si trova (fare un disegno) con \[ P(\bar B \cap A) = P(A) - P(A \cap B) = 0.3 - 0.04 = 0.26. \] Quindi \(P(\bar B | A) = 0.26/0.3 = 0.867.\)
\(A\) e \(B\) sono indipendenti se e solo se \(P(A \cap B) = P(A) P(B)\) e questo è chiaramente falso.
A = Chi risponde alla telefonata diventa un nuovo cliente B = Il rispondente si era avvalso l’anno prima dei servizi della concorrenza
\(P(A | B) =\) ?
Per la formula di Bayes \[ P(A|B) = P(B|A) P(A)/P(B) = 0.8 \cdot 0.15 /0.6 = 0.2 \]
Definite l’evento \(G = \) gli utili crescono.
Inoltre consiederate i tre eventi \(H, L\) e \(S\) definiti come segue.
\(H = \) i tassi del prossimo anno superano quelli correnti di più dell’1%
\(L =\) i tassi del prossimo anno sono inferiori a quelli correnti di più dell’1%
\(S = \) i tassi del prossimo anno si scostano da quelli correnti di meno dell’1%.
Per costruzione \(H, L, S\) sono una partizione dello spazio campionario (sono eventi necessari e incompatibili).
Allora si sa che \(P(G | H) = 0.1\), \(P(G | L) = 0.8\) e \(P(G | S) = 0.5\). Inoltre si sa anche che
\[ P(H) = 0.25 , \quad P( L) = 0.15, \quad P(S) = 0.6. \] Notate che la somma fa 1.
\[ P(G \cap H) = P(G|H) P(H) = (0.1)(0.25) = 0.025 \]
\[ P(G) = P(G|H) P(H) + P(G|L) P(L) + P(G|S)P(S) \] Questa è la formula delle probabilità totali. Si ottiene \[ P(G) = 0.025 + (0.8) (0.15) + (0.5)(0.6) = 0.445 \]
\[ P(L |G) = P(G|L) P(L) /P(G) = (0.8) (0.15) / 0.445 = 0.2697. \] Questa è la formula di Bayes.
L’esercizio è formulato in modo un po’ confuso. Se si legge attentamente alla fine si capisce che:
L’esperimento consiste nell’estrazione casuale di uno studente universitario.
Lo studente può essere bravo (B) , medio (M), scarso (S).
Siccome lo studente è bravo se si colloca tra il 25% dei migliori P(B) = 0.25 Siccome lo studente è scarso se si colloca tra il 25% dei peggiori P(S) = 0.25 Evidentemente P(M) = 0.5.
Siccome lo studente è ottimo se si collocava tra il 10% dei migliori P(O) = 0.1.
P(O | B) = 0.7 P(O | M) = 0.5 P(O | S) = 0.2
Quindi possiamo impostare la tabella seguente
O non O Tot
B 0.7 0.3 1
M 0.5 0.5 1
S 0.2 0.8 1
Tot 0.1 0.9 1
A questo punto vengono le domande.
\[ P(O) = P(O | B) P(B) + P(O | C) P(C) + P(O | S) P(S) = (0.7)(0.25) + (0.5)(0.5) + (0.2)(0.25) = 0.475. \]
(Sono esercizi normali che potete trovare nel compito). \[ P(M_1) = 0.4, \quad P(M_2) = 0.6 \] Sono le probabilità che le caramelle siano prodotte dalla macchina 1 e 2.
È la probabilità di produrre scatole difettose (sapore alterato) sapendo che il pezzo proviene dalla macchina 1 o 2.
La macchina 2 non produce pezzi difettosi e quindi la probabilità è 0. \[ P(M_1 \mid non D) = ? \]
è la probabilità che la scatola provenga dalla macchina 1 sapendo che il sapore non è alterato.
È una applicazione della regola di Bayes. \[ P(M_1 \mid non D) = \frac{P(non D \mid M_1) P(M_1)}{P(non D)} \] \[ \begin{aligned} P(non D \mid M_1) P(M_1) &= 0.36 \\ P(non D) &= P(non D \mid M_1) P(M_1) + P(non D \mid M_2) P(M_2) = 0.9 \cdot 0.4 + 1 \cdot 0.6 = 0.96 \end{aligned} \]
Quindi la soluzione è \(0.36/0.96 = 0.375\).
Notare che \(A_1\) e \(A_2\) sono complementari cioè \(P(A_2) = 1 - P(A_1)\).
Stessa cosa per \(B_1\) e \(B_2\). Quindi per la formula di Bayes:
\[ P[A_1 \mid B_2 ] = P[B_2| A_1] P[A_1] / P[B_2] = (1 - P[B_1 | A_1] ) P[A_1] / P[B_2] \]
Perché \(B_1\) è complementare di \(B_2\) !
Ora \(P[B_1] = P[B_1| A_1] P[A_1] + P[B_1 | A_2] P[A_2]\) per il teorema della probabilità totale.
Quindi \[ P[B_1] = 0.4 \cdot 0.5 + 0.7 \cdot 0.5 = 0.55 \] e quindi \(P[B_2] = 0.45\).
Allora \(P[A_1 | B_2] = ( 1 - 0.4) \cdot 0.5 / 0.45 = 0.66667.\)
Esercizio DIFFICILE.
\(A = \) Il prof. riceve il materiale \(B = \) il prof. adotta il libro
Sappiamo che \[ P(A) = 0.8, \quad P(B|A) = 0.3 \quad P(B | \bar A) = 0.1 \] Perciò si chiede \(P(A|B\) che si trova con la formula di Bayes
\begin{align*} P(A|B) &= \frac{P(B|A)P(A)}{P(B|A)P(A) + P(B|\bar A) P(\bar A)}\\ &= \frac{(0.3)(0.8)}{(0.3)(0.8) + (0.1)(1-0.8)} = 0.923 \end{align*}\(W =\) incidente causato da condizioni atmosferiche. \(BI=\) l’incidente ha provocato feriti. Abbiamo che \[ P(W) = 0.3\quad P(BI) = 0.2\quad P(W|BI) = 0.4 \] a. \(P(W \cap BI) = P(W|BI)P(BI) = (0.4)(0.2) = 0.08.\)
No, infatti \(P(W \cap BI) = 0.08 \ne 0.06 = P(W)P(B).\)
\(P(BI\mid W) = P(W \cap BI)/P(W) = 0.08 / 0.3 = 0.267.\)
Abbiamo
Sia \(G=\) arrivo cavi grossi e \(F=\) arrivo cavi fini.
Si sa che \(P(G \cup F) = 0.8\) e inoltre \(P(G \mid F) = 0.4\) mentre \(P(F \mid G) = 0.6\).
Perciò se si pone \[ P(G) = x; P(F) = y; P(G \cap F) = z \] risulta
\begin{align*} 0.8 &= P(G \cap F) = x + y - z \\ 0.4 &= P(G | F) = z/y \\ 0.6 &= P(F|G) = z/x \end{align*}È un sistema di tre equazioni in 3 incognite che va risolto e quindi si ottiene \[ x = 0.4211, \quad y = 0.6316, \quad z = 0.2526. \] Queste sono le soluzioni dei quesiti a. b. c.
E’ TROPPO DIFFICILE PER VOI!
Definiamo \(N =\) turno di notte, \(F = femmina\), \(M = maschio\), \(FP =\) favorevole al piano.
Sappiamo che
Perciò
\begin{align*} P(N \cap F) &= (0.5)(0.2) = 0.1, \\ P(FP) &= P(FP|M)P(M) + P(FP|F)P(F) = (0.5)(0.7) + (0.4)(0.3) = 0.47\\ P(N \cap FP) &= P(FP|N)P(N) = (0.65)(0.5) = 0.325\\ \end{align*}\[ P(FP\cap F) = P(FP|F)P(F) = (0.4)(0.3) = 0.12\]
\[P(N\cup F) = P(N) + P(F) – P(N \cap F) = 0.5 + 0.3 - 0.1 = 0.7\]
No, verifica che \[ P(N\cap F) = 0.1 \ne 0.15 = P(N)P(F).\]
\[ P(N|F) = P(N \cap F)/P(F) = 0.1/0.3 = 0.3333.\]
Abbiamo
Quindi
\(P(B \cap A) = P(A) P(B|A) = 0.10 \cdot 0.75 = 0.075.\)
\(P(A | B) = P(A \cap B) /P(B) = P(B \cap A) / P(B) = 0.075/ P(B).\) Ma \[ P(B) = P(B|A) P(A) + P(B| non A) P(non A) = 0.075 + 0.50 \cdot (1 - P(A)) = 0.075 + 0.5 \cdot 0.9 = 0.525. \]
Quindi \(P(A|B) = 0.075/ P(B) = 0.075/0.525 =0.1429.\)
Qual è la probabilità di pescare dai 100 pazienti proprio i precedenti 10?
Il numero di casi possibili è \(\dbinom{100}{10}.\) Il numero di casi favorevoli sono \(1!\)
Quindi abbiamo che la probabilità è \[ 1/\dbinom{100}{10} = 10! 90! / 100! = 1 /17310309456440. \]
Quando dice “si scelgono a caso 2 scatole” vuol dire che il numero di graffette \(X_1\) della prima scatola e \(X_2\) della seconda hanno la distribuzione di probabilità uguale a quella data e che sono indipendenti fra loro. La probabilità la prima scatola contenga come minimo 50 graffette è \[
P(X_1 \ge 50) = 0.29 + 0.2 + 0.1 + 0.03 = 0.62.
\] Chiamo questo evento \(A_1 = X_1 \ge 50\). Ovviamente anche per la seconda scatola \(P(X_2 \ge 50) = 0.62\). Chiamo questo secondo evento \(A_2 = X_2 \ge 50\). Ora chiede infine la probabilità che almeno una delle scatole contenga 50 o più graffette cioè \[
P(A_1 \cup A_2) = P(A_1) + P(A_2) - P(A_1\cap A_2)
\] Ora siccome le estrazioni delle due scatole sono indipendenti \(A_1\) e \(A_2\) sono due eventi indipendenti. Perciò abbiamo \[
P(A_1 \cup A_2) = P(A_1) + P(A_2) - P(A_1)P(A_2)
\]
e dunque \[
P(A_1 \cup A_2) = 0.62 + 0.62 - 0.62\times 0.62 = 0.8556.
\]
Diciamo che \(Y = 16+2X\) centesimi sia il costo di produzione e perciò l’utile è \(U =150 - Y = 150 - 16 - 2X = 134 - 2X\) centesimi. Il valor medio e la deviazione standard dell’utile sono perciò
Ora non resta che calcolare la media e la varianza di \(X\). Un pò di conti permettono di trovare \[ E(X) = 49.9 \qquad \mathrm{var}(X) = 1.3964^2 \] Quindi \[ E(X) = 134 - 2\times 49.9 = 34.2 \text{ centesimi }(\$0.34). \] e \[ \sigma(U) = 2 \times 1.3964 = 2.7928 \text{ centesimi } (\$0.0279). \]
Un lotto contiene il \(10\%\) di pezzi difettosi. Si scelgono a caso due pezzi e si controllano. \(X = \) numero di pezzi difettosi su due a. Calcolare la distribuzione di probabilità. \[ \begin{array}{cc} x & P(x) \\ 0 & 0.81\\ 1 & 0.18\\ 2 & 0.01\\ \end{array} \] Infatti \(X \sim Bin(n = 2, p = 0.1)\)
\begin{align*} P(X = 0) &= 0.9 \cdot 0.9 = 0.81\\ P(X = 1) &= 2\cdot 0.9 \cdot 0.1 = 0.18\\ P(X = 2) &= 0.1 \cdot 0.1 = 0.01 \end{align*}\(Y =\) numero di pezzi difettosi su due \[ \begin{array}{cc} y & P(y)\\ \hline 0 & 0.8053\\ 1 & 0.1895\\ 2 & 0.0053\\ \hline \end{array} \] Infatti
\begin{align*} P(Y = 0) &= \frac{18}{20} \frac{17}{19} = 0.8053\\ P(Y = 1) &= \frac{2}{20}\frac{18}{20} + \frac{18}{20}\frac{2}{19} = 0.1895\\ P(Y = 2) &= \frac{2}{20} \frac{1}{19} = 0.0053 \end{align*}È LUNGO e DIFFICILE!!
\(P = \) profitto \(X = \) numero di richieste \(S = \) numero di giornali in magazzino \[ P = \begin{cases} 0.2S - 0.05(X – S) & \text{ se } X > S \\ 0.2X& \text{ se } X = S \\ 0.2X - 0.7(S – X)& \text{ se } X < S \\ \end{cases} \] Profitto per ogni combinazione di \(S\) e \(X\).
\[ \begin{array}{rrrrrrr} S, X & 0 & 1 & 2 & 3 & 4 & 5 \\ 0 & 0.00& -0.05& -0.10& -0.15& -0.20& -0.25 \\ 1 & -0.70 & 0.20& 0.15& 0.10& 0.05& 0.00 \\ 2 & -1.40& -0.50& 0.40& 0.35& 0.30& 0.25 \\ 3 & -2.10& -1.20& -0.30& 0.60& 0.55& 0.50 \\ 4 & -2.80& -1.90& -1.00& -0.10& 0.80& 0.75 \\ 5 & -3.50& -2.60& -1.70& -0.80& 0.10 & 1.00 \\ \end{array} \]
Quindi calcolano i valori medi per ogni distribuzione condizionata.
\begin{align*} E[P|S=0] &= 0 +(-.05)(.16) + (-.1)(.18) + (-.15)(.32)+ \\ &+ (-.2)(.14) + (-.25)(.08) = -.122\\ E[P|S=1] &= (-.7)(.12) + (.2)(.16) + (.15)(.18) +\\ &+ (.1)(.32) + (.05)(.14) = .014\\ E[P|S=2] &= (-1.4)(.12) + (-.5)(.16) + (.4)(.18) + \\ &+(.35)(.32) + (.3)(.14) + (.25)(.08) = -.002\\ E[P|S=]3 &= (-2.1)(.12) + (-1.2)(.16) + (-.3)(.18) + \\ &+(.6)(.32) + (.55)(.14) + (.5)(.08) = -.189\\ E[P|S=4] &= (-2.8)(.12) + (-1.9)(.16) + (-1)(.18) +\\ &+ (-.1)(.32) + (.8)(.14) + (.75)(.08) = -.68\\ E[P|S=5] &= (-3.5)(.12) + (-2.6)(.16) + (-1.7)(.18) + \\ &+ (-.8)(.32) + (.1)(.14) + (1)(.08) = -1.304\\ \end{align*}Conclusione: il proprietario massimizza il profitto atteso ordinando 1 giornale.
La distribuzione del numero di partite vinte è binomiale con \(n = 5\) e \(p = 0.4\) Munendosi di pazienza oppure di una buona calcolatrice si ottiene la funzione di massa di probabilità e la funzione di ripartizione.
x p(x)
0 0.07776
1 0.25920
2 0.34560
3 0.23040
4 0.07680
5 0.01024
Tot 1.00000
x F(x)
0 0.07776
1 0.33696
2 0.68256
3 0.91296
4 0.98976
5 1.00000
La distribuzione è
y p(y)
0 0.1296
1 0.3456
2 0.3456
3 0.1536
4 0.0256
Ora la probabilità di vincere la maggioranza delle 5 partite è la probabilità di vincerne almeno 2 delle 4 restanti cioè
\[ 1 - P(Y = 0) - P(Y = 1) = 0.5248 \]
\[ E(X) = np = 5 \times 0.4 = 2. \]
E’ un esercizio difficilino.
La regola è basata sulla formula
\[ \frac{{S \choose x}{N-S \choose n-x}}{{N \choose n}} \]
dove \(N = \) numero di elementi della popolazione finita, \(S = \) numero di successi nella popolazione, \(n = \) dimensione del campione, \(x = \) numero di successi nel campione. Quindi
\[ \frac{{25 \choose 5}{25 \choose 7}}{{50 \choose 12}} = 0.2104 \]
Nella popolazione ci sono \(N = 400\) unità di cui \(S = 200\) successi. Estraggo un campione casuale senza ripetizione di dimensione \(n = 15\). Il numero di possibili campioni è
\[ \dbinom{400}{15} = \frac{400\cdot 399 \cdot 398 \cdot \cdots \cdot 386 }{15!} = 629498843449501998439382160 \]
Evidentemente non potete calcolarlo a mano!
Il numero di possibili campioni con \(8\) successi e \(6\) insuccessi sono \[ \dbinom{200}{8} {200 \choose 7} = 125840388797424048232485000 \]
Quindi la probabilità chiesta è il rapporto di questi due valori che risulta
\[ \frac{125840388797424048232485000}{629498843449501998439382160} = 0.1999. \]
ESERCIZIO IMPOSSIBILE DA FARE A MANO!
Se \(X\) è il numero di richieste inoltrate da immigrati, \(X\) è una variabile ipergeometrica con \(N = 10\), numero di successi (il numero di immigrati nella popolazione) \(S = 5\) e numerosità del campione \(n = 6\).
Qui le richieste approvate (per assurdo) sono state estratte a caso. Con molta pazienza e una calcolatrice si ottiene la funzione di massa di probabilità e la funzione di ripartizione.
x p(x) F(x)
0 0.00000000 0.00000000
1 0.02380952 0.02380952
2 0.23809524 0.26190476
3 0.47619048 0.73809524
4 0.23809524 0.97619048
5 0.02380952 1.00000000
La probabilità che meno della metà delle richieste APPROVATE sia stata inoltrata da immigrati è la probabilità che su 6 richieste approvate al massimo 2 siano state inoltrate da immigrati cioè \[ P(X \le 2) = 0.2619. \] ESERCIZIO DIFFICILE!
Le medie sono \(\mu_X =1.5\) e \(\mu_Y = 0.55\). La covarianza è
\begin{align*} \sigma_{XY} &= \sum_x \sum_y x y P(x,y) - \mu_x \mu_y \\ &= 0.3 \times 1 + 0.25 \times 2 - 1.5 \times 0.55 = -0.025. \end{align*}La varianza di \(X\) è \[ \sigma_X^2 = \sum x^2 P(x) - \mu_x^2 = 1 \times 0.5 + 4 \times 0.5 - 1.5^2 = 0.25 \] Analogamente la varianza di \(Y\) è \(\sigma^2 = 0.2475\). Perciò il coefficiente di correlazione è \[ \rho_{XY} = \frac{-0.025}{\sqrt{0.25 \times 0.2475}} = -0.1005. \]
Distribuzione marginale di \(X\): \(P(X = 1) = 0.4, P(X = 2) = 0.6\). Distribuzione marginale di \(Y\):\(P(Y = 0) = 0.6\), \(PY=1) = 0.4\).
Media e Deviazione standard di \(X\):
Covarianza tra \(X\) e \(Y\)
\[ \sigma_{XY} = 0(1)(0) + 0(2)(0.6) + 1(1)(0.4) + 1(2)(0) - 1.6(0.4) = -0.24 \]
Coefficiente di correlazione
\[ \rho_{XY} = \frac{(-0.24)}{\sqrt{0.24(0.24)}} = -1. \]
\[ E(W) = 2\mu_X - 4\mu_Y = 2(1.6) - 4(0.4) = 1.6 \]
Varianza di \(W\)
\begin{align*} \sigma^2_W &= 4 \sigma^2_X + 16 \sigma^2_Y - 2(2)(4) \sigma^2_{XY}\\ &= 4(0.24) + 16(0.24) - 2(2)(4)(-0.24) = 8.64. \end{align*}\[ \dbinom{7}{4}\; 0.6^4 0.4^3 + \dbinom{7}{5}\; 0.6^5 0.4^2 + \dbinom{7}{6}\; 0.6^6 0.4^1 + 0.6^7 = 0.71021 \]
c.i. Una volta che le prime 4 partite sono finite in parità la probabilità che A vinca è che vinca almeno 2 partite sulle restanti 3: \[ \dbinom{3}{2}\; 0.6^2 0.4^1 + \dbinom{3}{3}\; 0.6^3 0.4^0 = 0.648. \]
c.ii La probabilità che sia necessaria una 7ma partita per determinare il vincitore è la probabilità che sulle prossime 2 partite A ne vinca 1: \[ \dbinom{2}{1}\; 0.6^1 0.4^1 = 0.48. \] DIFFICILE.

\(P(Z >1.33)=1-P(Z \le 1.33)= 1-F(1.33)=1-0.9082=0.0918\)
\(P(Z <-1.70)= P(Z \ge 1.70)= 1-P(Z <1.70)=1-F(1.70)=1-0.9554=0.0446\) 
\(P(Z > -1) = P(Z < 1) = F(1) = 0.8413\) 
\(P(a < Z < b) = P(Z < b) - P(Z < a)\)

 NOTA BENE: in questi calcoli non importa se viene usato \(<\) o \(\le\)! Infatti per esempio \[ P(Z \le 1) = P(Z <1) + P(Z = 1) = P(Z<1) + 0 \] perché la normale è una variabile continua.
Puoi fare in due modi: 1) Fai la semisomma \((0.52 + 0.53)/2 = 0.525\) oppure 2) guardi quale tra i due valori di probabilità è più vicino a \(0.70\).
In questo caso è \(z = 0.52\). Infatti \(0.6985\) è più vicino a \(0.70\) di \(0.7019\).
Quindi si ragiona in questo modo. Si risolve il problema simmetrico
\[ P(Z < z) = 0.75 \]
dove \(0.75 = 1 - 0.25\). Si trova col metodo del punto precedente che \(z = 0.67\). Come si vede \(0.67\) è il terzo quartile della normale standard.
Il valore cercato che lascia a sinistra un’’area 0.25 deve invece essere \(z = -0.67\) perché è simmetrico rispetto alla media 0. Infatti
\[
P(Z < - 0.67) = 1 - P(Z < 0.67) = 1 - 0.75 = 0.25.
\]
Si nota anche che \(z = -0.67\) è il primo quartile della normale standard.
\[ P(Z < z) = 0.80 \]
Quindi si procede come per il caso a. e si trova \(z=0.84\).
\(X \sim N(80, \sigma = 10)\)
\[ P( 72 < X < 82) = P(X <82) - P(X < 72) \] Quindi si ottiene \[ P(Z < (82-80)/10 ) - P(Z < (72-80)/10) = P(Z < 0.2) - P(Z < -0.8) \] Dalle tavole \[ P(Z <0.2) = 0.5793 \] \[ P(Z < -0.8) = 1 - P(Z < 0.8) = 1 - 0.7881 \] e quindi il risultato è \(0.5793 - 1 - 0.7881 = 0.3674\).
Ora, si sa che \(P(Z > 1.282) = 0.1\) per la normale standard \(Z\) (guardate le tavole della t di Student ultima riga).
Quindi, poiché \(X = 80 + 10 Z\), si può scrivere \[ P(80 + 10 Z > 80 + 10 \cdot 1.282) = 0.1 \] cioè \[ P(X < 92.82) = 0.1 \] e quindi la risposta è \(x = 92.82\).
Perciò l’intervallo \((-1.75, 1.75)\) è centrato nella media e ha le caratteristiche richieste per la normale standard.
Ma qui abbiamo la normale \(N(80, \sigma = 10)\) e quindi l’intervallo richiesto si ottiene applicando l’inverso della trasformazione di standardizzazione, cioè: \[ \text{Estremo inferiore } = 80 - 1.75 \cdot 10 = 62.5, \quad \text{Estremo superiore } = 80 + 1.75 \cdot 10 = 97.5 \]
Notare la somiglianza con gli intervalli di confidenza (Capitolo 9).
\[ \frac{d - 1200}{100} = 1.28 \]
e allora il valore cercato \(d\) è \[ d = 1200 + 1.28 \times 100 = 1328. \]
Se \(X \sim N(\mu, \sigma)\) è il punteggio al test si chiede
\[ p = P( X > \mu + 1.5 \sigma) \]
Quindi standardizzando ambo i membri rispetto alla media e alla deviazione standard (incognite) di \(X\) si ottiene
\[ p = P( Z > [(\mu + 1.5\sigma) - \mu]/\sigma ) = P(Z > 1.5) \]
e quindi
\[ p = 1- P(Z\le 1.5) = 0.0668. \]
Sia \(X\) lo share televisivo e supponiamo che abbia una distribuzione di probabilità normale di media \(\mu\) e deviazione standard \(\sigma\). Si giudica che \[ P(X > 17.8) = 0.25, \text{ e } P(X > 19.2) = 0.15. \] Per la normale standard si trova consultando le tavole: \[ P(Z > 0.67) = 0.25 \text{ e } P(Z > 1.03) = 0.15. \] (Guardate \(F(z)\) e trovare lo \(z\) corrispondente.)
Perciò i valori \(17.8\) e \(19.2\) si possono scrivere come segue
\begin{align*} \mu + \sigma 0.67 &= 17.8 \\ \mu + \sigma 1.03 &= 19.2 \end{align*}Questo è un sistema lineare di due equazioni in due incognite che si può risolvere e fornisce come soluzioni \[ \mu = 15.265, \sigma = 3.7838. \]
È UN ESERCIZIO DIFFICILE!
Allora, si standardizza rispetto alla media e varianza di \(X\), e si ottiene \[ P(Z > (x - 150)/40) = 0.9 \]
Intanto cerchiamo \(k\) tale che per \(Z \sim N(0,1)\), \[ P(Z > k) = 0.9 \]
Sulla Tavola 2 della t di Student all’ultima riga (quella della normale standard) si trova \[ P(Z > 0.1) = 1.282 \] Quindi per simmetria avremo \[ P(Z > -1.282) = 0.9 \] Quindi il valore \(x\) cercato si trova risolvendo l’equazione \[ (x-150)/40 = -1.282 \] ossia \(x = 150 + (40)(-1.282) = 98.72.\)
\[ P(X < x) = 0.8 \]
Cioè
\[ P(Z < k) = P( Z < (x-150)/40) = 0.8 \] Questa volta si va sulla Tavola 1 e si cerca il valore più vicino a \(0.8\). Si vede che è \[ P(Z < 0.84) \simeq 0.8 \] quindi \(x\) soddisfa \[ (x - 150)/40 = 0.84 \] che si risolve ottenendo \(x = 150 + 40(0.84) = 183.6.\)
La probabilità di successo è \(p = P( X \ge 120 min) = P(Z \ge (120 - 150)/40) \) cioè \(1 - P(Z < -0.75) = P(Z < 0.75) = 0.7734.\)
La probabilità che su due studenti indipendenti almeno 1 sia un successo è la probabilità che non ci siano insuccessi = ( 1 -P(2 ) = 1 - q^2.) Siccome \(q = 1 - 0.7734 = 0.2266\) la risposta è ( 1 - q^2 = 1 - (0.2266)^2 = 0.9487.)
DIFFICILE
Sappiamo che \(X \sim N(\mu = 70, \sigma)\) ma la varianza non è nota. Quindi usiamo l’informazione \[ P(X < 85) = 0.9322 \] cioè standardizzando \[ P(Z < (85-70)/\sigma ) = 0.9322 \]
Poiché dalle Tavole della normale (Tavola 1 del Libro) si sa che \(P(Z < 1.5) = 0.9322\) avremo l’equazione \[ 1.5 = (85 - 70)/\sigma \] che risolta ci dà \[ \sigma = 10. \]
La probabilità che \(P(X > 80)\) è
\[ P(Z > (80 - 70)/10) = P(Z > 1) = 1- P(Z < 1) = 0.1587. \] Ora, se poni \(p = 0.1587\) come probabilità di \(1\) successo in \(1\) prova dove successo = lo studente supera \(80\) punti, l’esercizio chiede di trovare
\begin{align*} P(1, 2, 3, 4 \text{ successi su } 4 \text{ prove indipendenti e identiche}) & = 1 - P(0 \text{ successi in } 4 \text{ prove}) \\ &= 1- {4 \choose 0} p^0 q^4 \\ &= 1- 1\cdot (1- 0.1587)^4 = 0.4990394. \end{align*}La formula sopra deriva dal fatto che il numero di successi ha distribuzione Binomiale!!
È abbastanza DIFFICILE.
Il numero di successi è approssimabile con una normale con media \(np = 1600 \cdot 0.4 = 640\) e deviazione standard \(\sqrt{npq} = \sqrt{1600 \cdot 0.4 \cdot 0.6} = 19.6\).
Calcola \[ P(X > 690) \simeq P(Z > (690 - 640)/19.6) = P(Z > 2.55) \] cioè \(1- P(Z < 2.55) = 0.0054\).
Calcola
\[ P(X < 570) \simeq P(Z < (570 - 640)/19.6) = P(Z < -3.57) = 1 - 0.9888 = 0.0002. \]
\[ P( 550 < X < 650) = P( (550-640)/19.6 < Z< (650 - 640)/19.6) = P(-4.59 < Z< 0.51) \] Ora questa probabilità è \[ P(Z < 0.51) - P(Z < -4.59) = 0.695 - 0 = 0.695. \]
\(X\) = numero di successi \(\approx N(640, \sigma^2 = 384)\) e quindi \(\sigma = 19.6\).
Si chiede \(P(X < x) = 0.09\). Cerca sulle tavole della \(N(0,1)\) il valore \(z\) tale che \(P(Z < z) = 0.09\).
Questo valore non c’è perché è \(< 0.5\). Allora occorre cercare il valore simmetrico rispetto allo 0 cioè \(P(Z < -z) = 0.91\). Si trova \(P(Z < 1.34) \simeq 0.91\), e quindi \(P(Z < -1.34) = 0.09.\)
Quindi ritrasformando per \(X\) si ha \(x = 640 - (19.6)(1.34) = 613.74\). Quindi la risposta è \(614\) successi.
Chiede: trova \(x\) tale che \(P(X > x) = 0.20\). Si cerca allora sulle tavole della normale standard \(P(Z < z) = 0.80\). Si trova \(P(Z < 0.84) = 0.80\). Quindi ritrasformando per \(X\) si ha \[ x = 640 + (19.6)( 0.84) = 656.46 \] cioè \(656\) successi.
Poi hai che \[ P(\hat P < p) = P(Z < (p-0.4)/0.01224745) = 0.2 \]
Perciò poni \(k = (p-0.4)/0.01224745\) e poi osservi che \(P(Z < k) = 0.2\) è equivalente a
\[ P( Z < -k) = 0.8 \]
Quindi dalle tavole trovi che \(-k = 0.84\) (nota il MENO), ossia \[ -(p-0.4)/0.01224745 = 0.84 \] e infine risolvi l’equazione per trovare \(p\) \[ p = 0.4 - 0.84 * 0.01224745 = 0.3897121 \]
La durata è \(X \sim N(\mu = 35000, \sigma 4000)\). Sia \[ p = P (\bar X > 38000) \]
La probabilità che 1 pneumatico duri più di \(38 000\) km si calcola \[ p = P(Z > (38000 - 35000)/4000) = P(Z > 0.75) \]
Quindi
\[ p = 1 - P(Z < 0.75) = 0.22663 \]
Quindi \(p\) è la probabilità di successo in 1 prova. In un campione di \(n = 100\) prove indipendenti e identiche qual è la probabilità che ci siano più di 25 successi? Dobbiamo calcolare
\[ P(X > 25) \] dove \(X\) (il numero di successi) è binomiale con \(n = 100\) e \(p = 0.22663\). Il calcolo lo facciamo approssimando (visto che \(n\) è grande) \(X\) con una normale con media e varianza rispettivamente
\begin{align*} \mu &= n p = (100)(0.22663) = 22.663\\ \sigma^2 & = npq = (100)(0.22663)(1-0.22663) = 17.52688 \end{align*}Quindi abbiamo
\begin{align*} P(X > 25) &= P(Z > (25-22.663)/\sqrt{17.52688}) \\ &= P(Z > 0.56) \\ &= 1-P(Z<0.56) = 0.2877 \end{align*}E’ DIFFICILE
È un esercizio facile. Se \(T = X + Y + Z\) è il guadagno totale allora \[
E(T) = \mu_X + \mu_Y + \mu_Z = 20000 + 25000 + 15000 = 60000
\] e visto che sono \(X, Y\) e \(Z\) indipendenti
\[
\mathrm{var}(T) = \sigma_X^2 + \sigma_Y^2 + \sigma_Z^2 = 2000^2 + 5000^2 + 4000^2
\] Quindi la deviazione standard è \[
\sigma_T = \sqrt{2000^2 + 5000^2 + 4000^2} = 6708.2
\]
Abbiamo che il numero di unità vendute è \(X \sim N(\mu_X = 400, \sigma_X^2 = 900)\), e il numero di unità prodotte è \(Y \sim N(\mu_Y = 400, \sigma^2_Y = 1600)\).
Inoltre il prezzo di vendita unitario è 10 dollari. Quindi il ricavo è \(10X\). Il costo unitario di produzione è \(4\) dollari, quindi il costo fisso di produzione è \(4 Y\).
La differenza tra i due è \[ W = 10X - 4Y \] Siccome \(X\) e \(Y\) sono normali allora \(W\) è normale. Rispetto alle solite applicazioni qui però le due normali sono correlate. Questo caso non l’abbiamo mai visto a lezione.
Comunque possiamo calcolare la media e la varianza della variabile \(W\) usando le regole viste per le variabili doppie discrete. Perciò \[ E(W) = 10 \mu_X - 4\mu_Y = 10(400) - 4(400) = 2400 \] \[ \mathrm{var}(W) = 100 \sigma^2_X + 16 \sigma^2_Y - 2(10)(4) \sigma_{XY} \] Dobbiamo trovare la covarianza che è \[ \sigma_{XY} = \rho_{XY} \sigma_X\sigma_Y = 0.5(30)(40) = 600 \] Quindi \[ \mathrm{var}(W) = 100(900) + 16(1600)- 2(10)(4)(600) = 67600 \] e dunque \[ \sigma_W = \sqrt{67600} = 260. \] A questo punto la domanda finale chiede qual è la probabilità \[ P(W > 2000)? \] Siccome \(W \sim N(\mu_W= 2400,\sigma_W = 260)\) abbiamo \[ P(W > 2000) = P(Z > (2000 - 2400)/260 ) = P(Z > - 1.54) \] e questa è uguale a \[ P(Z < 1.54) = 0.9382 \] È DIFFICILE.
\[ P(Z < \frac{50-70}{\sqrt{70}} = P(Z < -2.39) = 1- F_Z(2.39) = 0.0084. \]
x P(X=x)
0 0.25
1 0.50
2 0.25
x P(X=x)
0 0.0625
1 0.2500
2 0.3750
3 0.2500
4 0.0625
Funzione di probabilità
x P(X=x)
0 0.000977
1 0.009766
2 0.043945
3 0.117188
4 0.205078
5 0.246094
6 0.205078
7 0.117188
8 0.043945
9 0.009766
10 0.000977
b . Abbiamo
\[ P(\bar X > 102) = P( Z > (102-100)/1.80) = P(Z> 1.11). \]
Dalle tavole si trova che il risultato è 0.1335.
\[ \begin{align*} P( 98 \le \bar X \le 101)& = P((98 - 100)/1.8 \le Z \le (101 - 100)/1.8)\\ &= P( -1.11 \le Z \le 0.56) \\ &= P(Z \le 0.56) - [1- P(Z \le 1.11)]\\ &= 0.7123 - 0.1335 = 0.5788. \end{align*} \]
\[ \begin{align*} P(\bar X \le 101.5) &= P[Z \le (101.5-100)/1.8] \\ &= P(Z \le 0.83) =0.7967 \end{align*} \]
Sia \(X\) la variabile prezzo di vendita delle nuove abitazioni; \(X\) ha distribuzione incognita, media e deviazione standard note: \(X \sim N( \mu = 115000;\sigma = 25000)\).
Sia \(n=100\) l’ampiezza di un campione casuale estratto da \(X\).
\[ \bar X \sim N(115000 , \sigma_{\bar X} = 25000\sqrt{100} = 2500) \]
La probabilità richiesta è
\[ P(\bar X > 110000) = P(Z > (110000 - 115000) /2500) = P(Z > -2) = 0.9772 \]
\[ 113000< X < 117000) = P(-0.4 < Z< 0.4) = 0.6554-(1-0.6554)= 0.3108 \]
d. Essendo gli intervalli di stessa ampiezza e sfruttando la simmetria della distribuzione normale rispetto alla sua media \(115000\), \([114000; 116000]\) è l’intervallo in cui è più probabile trovare il prezzo medio campionario.
\(ES = \sigma/\sqrt{100} = 40/10 = 4.\)
Media campionaria = \(\bar X \approx N(\mu, \sigma = 40/10 = 4)\) in quanto il campione è grande. Nota che: \(Z = (\bar X - \mu)/4 \sim N(0,1).\)
Quindi, chiede \(P(\bar X > \mu + 5)\). Ossia standardizzando,
\[ P(Z > (\mu + 5 - \mu)/4 ) = P( Z> 5/4) = 1 - P(Z \le 1.25) = 1 - 0.8944 = 0.1056. \]
\(P(\bar X - \mu > 4) = P(4 Z > 4) = 1 - P(Z \le 1) = 1 - 0.8413.\)
Questa volta chiede che la distanza tra la media campionaria \(\bar X\) e \(\mu\) sia maggiore di 3. Si usa perciò il valore assoluto:
\[ \begin{align*} P(| \bar X - \mu | > 3) &= P(4|Z| > 3)\\ &= P(Z \le -0.75) + P(Z > 0.75)\\ &= 2(1- 0.7734) = 0.4532. \end{align*} \]
X = livello di impurità \(\sim N(\mu, \sigma = 1.6)\); Campione casuale \(n = 100\). \(\bar X\sim N(\mu, \sigma/\sqrt{n} = 0.16)\).
cioè \[ P(\bar X - \mu > k) = 0.05 \] Divido ambo i membri della disuguaglianza per \(\sigma/\sqrt{n} = 0.16\) e ottengo \[ P(Z > k/0.16)= 0.05 \]
Perciò poiche nella normale standard \(P(Z > h) = 0.05\) si ha per \(h = 1.645\) dovremo avere qui \(k/0.16 = 1.645\) e cioè \(k = 0.16 \cdot 1.645 = 0.2632.\)
Nella normale standard \(P(Z < h) = 0.10\) si ha per \(h = - 1.282\).
ATTENZIONE: guarda le tavole della t di Student ultima riga: \(P(Z > 1.282) = 0.10\).
Quindi qui occorre che \(-k/0.16 = -1.282\), cioè \(k = 0.16 \cdot 1.282 = 0.205\). Il libro dà come soluzione \(- 0.205\), ma si sbaglia. La media campionaria deve essere inferiore di 0.205 alla media della popolazione non di MENO 0.205.
Quindi \(P(|Z| > k /0.16) = 0.15\). Poiché nella Normale standard \(P(|Z| > k) = 0.15\) si ha per \(k = 1.44\).
ATTENZIONE: guarda le tavole della Normale.
Per \(z = 1.44\) \(P(Z < 1.44) = 0.925\). Quindi a destra di \(1.44\) ci sta \(1 - 0.925 = 0.075 = 7.5\%\). Analogamente a sinistra di \(-1.44\) ci sta \(7.5\%\) e quindi complessivamente nelle due code ci sta il 15%. Guarda la figura: le due code sono delimitate da \(-1.44\) e \(1.44\).
Pertanto nel nostro caso \(k/0.16 = 1.44\) e cioè \(k = 0.16 \cdot 1.44 = 0.2304\).
Ore = \(X \sim N(\mu, \sigma = 8.4)\). Dimensione campionaria \(n\) incognita. La distribuzione campionaria della media è
\[ \bar X \sim N(\mu, 8.4/\sqrt{n}). \]
Scriviamo la condizione in un altro modo: \[ P( \bar X > \mu + 2 \text{ oppure } \bar X < \mu - 2) \le 0.05 \]
Quindi possiamo scrivere anche
\[ P( \bar X > \mu + 2) + P( \bar X < \mu - 2) \le 0.05 \]
Poi si nota anche che
\[ P( \bar X > \mu + 2) = P( \bar X < \mu - 2) \]
Quindi la condizione che è data all’inizio si può sostituire con \[ 2 P(\bar X > \mu + 2) \le 0.05. \]
Calcolo la probabilità a primo membro standardizzando rispetto a media e varianza di \(\bar X\).
\[ P( \bar X > \mu + 2) = P( Z > \frac{\mu + 2 - \mu}{ 8.4/\sqrt{n}}) = P(Z > \sqrt{n} \frac{2}{8.4}) \]
Quindi la condizione che deve essere rispettata è
\[ 2 P(Z > \sqrt{n} \frac{2}{8.4}) \le 0.05 \] ossia \[ P(Z > \sqrt{n} \frac{2}{8.4}) \le 0.025 \]
Pongo \(h = \sqrt{n} \frac{2}{8.4} \) e cerco di risolvere l’equazione
\[ P( Z > h) = 0.25 \text{ ossia } P(Z \le h) = 0.975 \]
Le tavole della normale ci dicono che deve essere ( h = 1.96). Perciò
\[ h = \sqrt{n} \frac{2}{8.4} = 1.96 \]
Si risolve rispetto all’incognita \(n\) ottenendo
\[ \sqrt{n} = \frac{8.4 \cdot 1.96}{2} = 8.232 \]
da cui \(n = 67.77\). Perciò basta che \(n = 68\) affinché la richiesta sia soddisfatta. All’aumentare di \(n\) poiché \(\sigma/\sqrt{n}\) decresce e la probabilità nelle code diminuisce, si otterrà di sicuro che la probabilità richiesta sia \(\le 0.05\).
Se si cambia \(0.05\) in \(0.10\) ovviamente invece di \(1.96\) basterebbe un valore più piccolo e quindi \(n\) è minore.
Se si cambia \(0.05\) in \(0.01\) invece di \(1.96\) ci vorrebbe un valore più grande e quindi un \(n\) maggiore.
SE \(= \sqrt{pq/100}\). Il massimo errore si ha per \(p = 0.5\) cioè \[ \max \text{SE} = 0.5/10 = 0.05. \]
Chiede di trovare \(n\) tale che \(P(| \text{Proporzione} - p | > 0.03) = 0.05.\) Quindi siccome Proporzione \(\approx N(p, \sigma = 0.5/\sqrt{n} )\), allora \(Z = \sqrt{n} (\text{Proporzione} - p)/0.5 \sim N(0,1)\) ossia \[ \text{Proporzione} - p = Z / (2 \sqrt{n}). \] Allora \[ P(| \text{Proporzione} - p | > 0.03) = P(|Z| > 0.03 \cdot [2 \cdot \sqrt{n}] ) = 0.05. \] Siccome sappiamo che \(P(|Z| > 1.96) = 0.05\) occorre che \[ 0.03 \cdot [ 2 \cdot \sqrt{n}] = 1.96 \] e quindi \(\sqrt{n} = 1.96/ 0.06 = 32.67\) e dunque \(n > 32.67^2 = 1067.1\).
\[ \hat p = \frac{211}{528} = 0.3996 \] Quindi \[ \sigma_{\hat p} = \sqrt{\frac{(0.3996)(0.6.004)}{120}} = 0.03934. \] b. Risulta che la probabilità cercata è \[ P( Z < (0.33 - 0.3996)/0.03934) = P(Z < -1.77) = 0.0384 \]
ESERCIZIO DIFFICILE
Sia \(Y\) l’aumento di stipendio. Allora \(Y \sim N( 12, \sigma = 3.6)\). Estraggo a caso un dirigente e dico che ottengo un successo se l’aumento è ( Y < 10%). La probabilità di successo è \[ p = P( Y < 10) = P(Z < (10-12)/3.6) = P( Z< -0.56). \] Quindi \[ p = 1- P(Z < 0.56) = 1- 0.7123 = 0.2877. \] Poi considero un campione casuale (con ripetizione) di dirigenti dimensione \(n = 81\) e guardo la proporzione di successi \(\hat P\) di successi nel campione.
L’esercizio chiede di calcolare la probabilità \(P(\hat P > 0.5) \).
Ora \(\hat P \) ha distribuzione binomiale con media \(p = 0.2877\) e deviazione standard \[ \sigma_P = \sqrt{\frac{pq}{n}} = \sqrt{\frac{(0.2877)(0.7123)}{81}} = 0.0503. \] Quindi usando l’approssimazione normale alla Binomiale \[ P( \hat P > 0.5) \approx P( X > 0.5) \] dove \(X \sim N( p, \sigma_P)\). Pertanto \[ P(X > 0.5) = P(Z > (0.5- 0.2877)/0.0503) = P(Z > 4.22) = 0. \]
\(P(\bar X > 450) = 1 - P(Z < (450 - 420)/20) = 1 - P(Z < 1.5) = 0.0668\).
Significato: qual è il valore \(c\) tale che \(P( \bar X > c) = 0.10\) ? È uguale a \(P(\bar X\le c) = 0.9\). Per la normale standard il valore \(z\) tale che \(P(Z > z) = 0.10\) è \(z = 1.28\) (guardate sulle tavole). Ma \(\bar X\) ha distribuzione \(N(420, \sigma = 100/\sqrt{25} = 20)\) e quindi dovete trasformarlo con \[ c = 420 + 20 \cdot 1.28 = 445.6. \]
Significato: Qual è il valore \(z\) tale che \(P(\bar X < 0.10)\)? Siccome per la normale standard il valore \(z\) tale che \(P(Z \le z) = 0.10\) è \(z= -1.28\) il valore cercato è \(c = 420 + 20 \cdot (-1.28) = 394.4.\)
Significato: qual è il valore \(k\) tale che \(P(\text{Deviazione stand.} > k) = 0.05\) ossia \(P(S^2 > k^2) = 0.05\) ?
Per risolvere questo esercizio bisogna sapere la distribuzione campionaria (chi-quadro) della varianza, che però non è in programma.
Stesso problema dell’esercizio e.
Sarebbe stata minore perché la distribuzione di \(\bar X\) avrebbe avuto la stessa media, ma varianza più piccola e quindi le code si sarebbero ritirate.
Poiché \(npq = 60 \cdot 0.8 \cdot 0.2 = 9.6 > 9\) si può usare l’approssimazione normale. \[ P \approx N(\mu = p = 0.8, \sigma = \sqrt{(0.8\cdot 0.2)/60} = 0.05163978). \]
Perciò \[ P( P < 0.7) = P(Z < (0.7 - 0.8)/ 0.05163978) = P( Z < -1.94) = 0.0262. \]
Se il campione fosse di \(6\) soltanto occorre usare la Binomiale perché l’approssimazione normale non va bene. \[ P( P < 0.7) = P( \text{#successi}/6 < 0.7) = P(\text{\# successi } < 4.2) = 1 - P(\text{\#successi} = 5 o 6). \] Quindi \[ P(\text{\# successi} = 5) = \dbinom{6}{5} p^5 q^1 = 6 \cdot 0.8^5 \cdot 0.2 = 0.393216 \] \[ P(\text{\# successi} = 6) = p^6 = 0.8^6 = 0.262144 \] e infine \[ P( P < 0.7) = 1 -0.393216- 0.262144 = 0.34464. \]
In un campione di \(n = 6\), \(\bar{X}\) = stipendio medio \(\sim N(29000, 4000/\sqrt{6} = 1632.993 = \sigma(\bar X))\)
\[ P(\bar X >30000) = P(Z > (30000 - 29000)/1632.993) = P( Z > 0.61) = 0.2709. \]