Deprecated: Function set_magic_quotes_runtime() is deprecated in /DISK2/WWW/lokiware.info/mff/wakka.php on line 35
Pravděpodobnost a statistika
Přednášející: Jaromír Antoch (na jeho webu ale žádné informace, vyjma toho, jak se zapisují výsledky do indexů, a výsledků zkoušek nenajdete:()
Zkouška
Zkoušky probíhají v Karlíně. Jsou na ně dvě hodiny čistého času, dost lidí odevzdává dříve. Bude se vám hodit kalkulačka. Hodnoty kvantilů a distribučních funkcí se na dřívějších termínech zřejmě studentům na požádání sdělovaly, teď (26. 1. 2008) je stačilo uvádět ve formě Φ(číslo) apod., přičemž to číslo, pokud si pamatuju vyšlo v jednom příkladě přesně 1 a v dalším přesně 2 (nebo 1.75, viz
[2008–01–26-B] (2) níže).
Známkování je dost mírné, výsledky bývají ještě týž den na
Antochových stránkách, kdyby vás zajímalo, jak bodování/známkování vypadá, mrkněte tam na dosavadní výsledky.
Dost informací o minulých zkouškách najdete na
velké matfyzácké wiki. Čerstvé zážitky z tohoto roku na
fóru a psát je můžete i sem:).
Řešené úlohy
Na zkoušce 26. 1. 2008 (varianta B) (celé zadání na fóru) se objevila mj. následující úloha. Myslím, že dost lidí ji nemělo, takže tady je zadání a řešení:
- [2008–01–26-B] (2) Pravděpodobnost, že právě nabootovaný stroj do svého řádného vypnutí nezatuhne je 0.8. Určete pravděpodobnost toho, že stroj během 100 nezávislých zapnutí nevytuhne alespoň 88krát.
Řešení:
Označme hodnoty n = 100, p = 0.8, k = 88. P = P[během 100 nezávislých zapnutí nevytuhne alespoň 88krát] = ?.
Nechť
X ~ Bi(
n,
p). Potom zřejmě platí:
P = P[ X \ge k ] = \sum_{i=k}^{100} P[ X = i] = \sum_{i=k}^{n} {n \choose i} p^i (1-p)^{n-i} = \sum_{i=88}^{100} {100 \choose i} 0.8^i 0.2^{100-i} \approx 0.0253 = 2.53 \%
To je dost přesný správný výsledek, ale nikdo asi nečekal, že byste na zkoušce tu sumu počítali, takže lze provést aproximaci podle CLV:
P = P[ X \ge k ] = 1 – P[ X < k ] = 1 – P\Bigl[ \frac{X-np}{\sqrt{np(1-p)}} < \frac{k-np}{\sqrt{np(1-p)}}\Bigr] \approx_{CLV} 1 -\Phi\Bigl( \frac{k-np}{\sqrt{np(1-p)}} \Bigr) = 1 -\Phi\Bigl( \frac{88–100\cdot0.8}{\sqrt{100\cdot0.8\cdot0.2}} \Bigr) = 1 – \Phi(2) \approx 1 – 0.9772 = 0.0228 = 2.28 \% (Nejsme zas tak daleko od přesného výsledku.)
Pokud vám úplně nevoní, že v CLV má být neostrá nerovnost, mohli jste to spočíst
jakoby korektněji takhle:
P = P[ X \ge k ] = 1 – P[ X \le k-1 ] = 1 – P\Bigl[ \frac{X-np}{\sqrt{np(1-p)}} \le \frac{k-1-np}{\sqrt{np(1-p)}}\Bigr] \approx_{CLV} 1 -\Phi\Bigl( \frac{k-1-np}{\sqrt{np(1-p)}} \Bigr) = 1 -\Phi\Bigl( \frac{88–1-100\cdot0.8}{\sqrt{100\cdot0.8\cdot0.2}} \Bigr) = 1 – \Phi(1.75) \approx 1 – 0.9599 = 0.0401 = 4.01 \% (Jsme docela dost mimo:(.)
I když to vypadá jako dost jasný příklad, přiznám se, že při zkoušce jsem tam napsal nějakou hovadinu, a když jsem o tom pak po cestě metrem přemýšlel, první, co mě napadlo bylo počítat to přes negativně binomické rozdělení (jako součet pravděpodobností, že 88. nevytuhnutí přijde při 88., 89. až 100. zapnutí):
P = \sum_{i=k}^{100} P[ NBi(k,p) = i] = \sum_{i=k}^{n} {i-1 \choose k-1} p^k (1-p)^{i-k} = \sum_{i=88}^{100} {i-1 \choose 88–1} 0.8^88 0.2^{i-88} \approx 0.0253 = 2.53 \%
Jak vidíte, vyjde to úplně stejně jako přes binomické rozdělení (i když rovnost těch sum není na první pohled vidět), ale těžko na to aplikovat CLV.
Když jsem si to takhle doma všechno takhle spočetl, docela mě překvapilo, jak je ten odhad pomocí CLV mimo. Zvlášť ten druhý, který mi přijde správnější. Holt dost malé n.
Starší úlohy:
- [2007–01–27] (1) Má-li délka telefonních hovorů (v minutách) exponenciální rozdělení se střední hodnotou 2 minuty, určete jaká je pravděpodobnost, že náhodný hovor je delší než 2 minuty. (Možnosti: 0.5 %, 5 %, 15 %, 37 %, 50 %)
Řešení: U exp. rozdělení: 1/λ = E X, tedy máme λ = 1/2, F(x) = 1 – e-λt, z toho snadno spočteme pravděpodobnost P[t > 2] = 1 – P[t ≤ 2] = 1 – F(2) = (dosazení) = 1/e = přibližně 37 %
- [2007–01–27] (2) Uvažujme výběr X1, …, Xn z alternativního rozdělení s parametrem 0.3 a náhodnou veličinu Y = suma přes i od 1 do n Xi.
(a) Určete rozdělení Y. (Binomické Bi(0.3), z definice binomického rozdělení.)
(b) Určete k čemu ve vhodném smyslu konverguje Y/n. (Podle SZVČ: Konverguje podle pravděpodobnosti ke střední hodnotě Xi, tj. 0.3.)
(c) Má rozdělení Y nějaký vztah k Poissonovu rozdělení. (Poissonovo rozdělení s parametrem λ = 0.3n, Po(0.3n) může pro velká n sloužit jako jeho aproximace. Pro n jdoucí do nekončna by k němu konvergovalo, to je ale v tomhle případě, kdy je pevné p a i λ by tedy šla do nekonečna, asi nesmysl říkat.)
- [2008–07–02] (3) Ma-li doba obsluhy (v minutach) zakaznika v bance exponencialni rozdeleni se stredni dobou 5 minut, urcete:
(a) pravdepodobnost, ze zakaznik bude obsluhovan dele nez 5 minut
(b) stredni hodnotu aritmetickeho prumeru dob obsluhy 100 zakazniku
(c) rozptyl aritmetickeho prumeru dob obsluhy 100 zakazniku
(d) pribliznou pravdepodobnost jevu, ze zamestnanec banky stihne behem sve pracovni doby, jez je 8 hodin, obslouzit 78 zakazniku, jejichz pozadavky spolu nesouvisi
(e) Sestavte asymptoticky test pomoci nejz lze prokazat, ze stredni doba obsluhy jednoho zakaznika prevysuje 5 minut
(f)pomoci testu sestrojenem v predchozim bode rozhodnete na 5% hladine vyznamovosti
Řešení:
Použijme jako jednotku minutu, potom parametr exp. rozdělení λ = 1/5
(a) 1/e = cca 37 % (viz [2007–01–27] (1))
(b) počet zákazníků nemá vliv: μ100 = μ = 5 min
(c) σ1002 = σ2/100 = 1/(100 * λ2) = 25/100 = 1/4 (resp. 1/4 min2)
(d) Pomocí CLV. Mně vyšlo: cca Φ( (480–78*5)/sqrt(78*25) ) = cca Φ( 2.04 ) = cca 0.9793 = cca 98 %
(e,f) ...
- dalsi otazky
Zdroje
Cvičení