13 feiten over de ongelijkheid en centrale limietstelling van Chebyshev


In de kanstheorie is de De ongelijkheid van Chebyshev & centrale limietstelling behandelen de situaties waarin we de kansverdeling willen vinden van de som van grote aantallen willekeurige variabelen in ongeveer normale toestand. Voordat we de limietstellingen bekijken, zien we enkele van de ongelijkheden, die de grenzen voor de kansen bieden als gemiddelde en variantie bekend is.

Inhoudsopgave

Markovs ongelijkheid

De ongelijkheid van Markov voor de willekeurige variabele X die alleen een positieve waarde heeft voor a>0 is

[latex]P\{X \geq a\} \leq \frac{E[X]}{a}[/latex]

om dit te bewijzen voor a>0 overweeg

[latex]I=\left\{\begin{array}{ll}
1 & \text { if } X \geq a \\
0 & \tekst { anders }
\end{array}\rechts.[/latex]

Sinds

[latex]X \geq 0 \\

\\ ik \leq \frac{X}{a}[/latex]

nu in afwachting van deze ongelijkheid die we krijgen

[latex]E[I] \leq \frac{E[X]}{a}[/latex]

de reden is

[latex]E[I]=P\{X \geq a\}[/latex]

wat de ongelijkheid van Markov geeft voor a>0 as

[latex]P\{X \geq a\} \leq \frac{E[X]}{a}[/latex]

De ongelijkheid van Chebyshev

    voor de eindige gemiddelde en variantie van willekeurige variabele X de ongelijkheid van Chebyshev voor k>0 is

[latex]P(|X-\mu| \geq k\} \leq \frac{\sigma^{2}}{k^{2}}[/latex]

waarbij sigma en mu de variantie en het gemiddelde van de willekeurige variabele vertegenwoordigen, om dit te bewijzen gebruiken we de Markovs ongelijkheid als de niet-negatieve willekeurige variabele

[latex](X-\mu)^{2}[/latex]

voor de waarde van a als constant kwadraat, vandaar

[latex]P\left\{(X-\mu)^{2} \geq k^{2}\right\} \leq \frac{E\left[(X-\mu)^{2}\right ]}{k^{2}}[/latex]

deze vergelijking is gelijk aan

[latex]P(|X-\mu| \geq k\} \leq \frac{E\left[(X-\mu)^{2}\right]}{k^{2}}=\frac{ \sigma^{2}}{k^{2}}[/latex]

zo duidelijk

[latex](X-\mu)^{2} \equiv k^{2} \text{als en alleen als} |X-\mu| \geq k[/latex]

Voorbeelden van de ongelijkheden van Markov en Chebyshev :

  1. Als de productie van een specifiek item als willekeurige variabele wordt genomen voor de week met gemiddelde 50, bereken dan de kans dat de productie in een week de 75 overschrijdt en wat zou de kans zijn als de productie van een week tussen 40 en 60 ligt, op voorwaarde dat de variantie daarvoor week 25?

Oplossing: beschouw de willekeurige variabele X voor de productie van het item gedurende een week en om de waarschijnlijkheid van een productie van meer dan 75 te vinden, zullen we gebruiken Markovs ongelijkheid as

[latex]P(X>75\} \leq \frac{E[X]}{75}=\frac{50}{75}=\frac{2}{3}[/latex]

Nu zullen we de waarschijnlijkheid voor de productie tussen 40 en 60 met variantie 25 gebruiken De ongelijkheid van Chebyshev as

[latex]P\{|X-50| \geq 10\} \leq \frac{\sigma^{2}}{10^{2}}=\frac{1}{4}[/latex]

so

[latex]P\{|X-50|<10\} \geq 1-\frac{1}{4}=\frac{3}{4} [/latex]

dit toont de kans voor de week als de productie tussen 40 en 60 is 3/4.

2. Laat zien dat de ongelijkheid van chebyshev die de bovengrens van de kans geeft, ligt niet bijzonder dichter bij de werkelijke waarde van de kans.

Oplossing:

Overweeg dat de willekeurige variabele X uniform is verdeeld met gemiddelde 5 en variantie 25/3 over het interval (0,1) en vervolgens door de ongelijkheid van chebyshev we kunnen schrijven

[latex]P(|X-5|>4\} \leq \frac{25}{3(16)} \circa 0.52[/latex]

maar de werkelijke kans zal zijn

[latex]P(|X-5|>4\}=0.20[/latex]

wat verre van de werkelijke kans is, ook als we de willekeurige variabele X nemen als normaal verdeeld met gemiddelde en variantie dan De ongelijkheid van Chebyshev zal zijn

[latex]P\{|X-\mu|>2 \sigma\} \leq \frac{1}{4}[/latex]

maar de werkelijke kans is

[latex]P(|X-\mu|>2 \sigma\}=P\left\{\left|\frac{X-\mu}{\sigma}\right|>2\right\}=2[ 1-\Phi(2)] \ongeveer 0.0456
[/latex]

Zwakke wet van grote getallen

De zwakke wet voor de reeks willekeurige variabelen zal worden gevolgd door het resultaat dat De ongelijkheid van Chebyshev kan worden gebruikt als hulpmiddel voor bewijzen, bijvoorbeeld om te bewijzen

[latex]P\{X=E[X]\}=1[/latex]

als de variantie nul is, zijn dat de enige willekeurige variabelen met varianties gelijk aan 0, die zijn constant met kans 1 dus door De ongelijkheid van Chebyshev voor n groter dan of gelijk aan 1

[latex]P\left\{|X-\mu|>\frac{1}{n}\right\}=0[/latex]

as

[latex]n \rechts \infty[/latex]

door de continuïteit van de waarschijnlijkheid

[latex]\begin{uitgelijnd}
0=\lim _{n \rightarrow \infty} P\left\{|X-\mu|>\frac{1}{n}\right\} &=P\left\{\lim _{n \rightarrow \infty}\left\{|X-\mu|>\frac{1}{n}\right\}\right\} \\
&=P\{X \neq \mu\}
\end{uitgelijnd}[/latex]

wat het resultaat bewijst.

Zwakke wet van grote getallen: Voor de reeks van identiek verdeelde en onafhankelijke toevalsvariabelen X1,X2,……. die elk het eindige gemiddelde E[X . hebbeni]=μ, dan voor elke ε>0

[latex]P\left\{\left|\frac{X_{1}+\cdots+X_{n}}{n}-\mu\right| \geq \varepsilon\right\} \rightarrow 0 \quad \text { as } \quad n \rightarrow \infty[/latex]

om dit te bewijzen nemen we aan dat variantie ook eindig is voor elke willekeurige variabele in de reeks, dus de verwachting en variantie

[latex]E\left[\frac{X_{1}+\cdots+X_{n}}{n}\right]=\mu \quad \text { and } \quad \operatorname{Var}\left(\ frac{X_{1}+\cdots+X_{n}}{n}\right)=\frac{\sigma^{2}}{n}[/latex]

nu van de De ongelijkheid van Chebyshev de bovengrens van de kans als

[latex]P\left\{\left|\frac{X_{1}+\cdots+X_{n}}{n}-\mu\right| \geq \varepsilon\right\} \leq \frac{\sigma^{2}}{n \varepsilon^{2}}[/latex]

wat voor n neigend naar oneindig zal zijn

[latex]P\left\{\left|\frac{X_{1}+\cdots+X_{n}}{n}-\mu\right| \geq \varepsilon\right\} \rightarrow 0 \quad \text { as } \quad n \rightarrow \infty[/latex]

Centrale limietstelling

De centrale limietstelling is een van de belangrijke resultaten in de kansrekening omdat het de verdeling geeft van de som van grote getallen die ongeveer normaal is distributie naast de methode voor het vinden van de geschatte kansen voor sommen van onafhankelijke willekeurige variabelen centrale limietstelling toont ook de empirische frequenties van zoveel natuurlijke populaties vertonen klokvormige gemiddelde normale krommen. Voordat we de gedetailleerde uitleg van deze stelling geven, gebruiken we het resultaat

“Als de reeks willekeurige variabelen Z1,Z2,…. hebben de verdelingsfunctie en de momentgenererende functie als FZn en Mzn harte

[latex]M_{Z_{n}}(t) \rightarrow M_{Z}(t) \text{ voor alle t, dan } F_{Z_{n}}(t) \rightarrow F_{Z}(t) \text{ voor alle t waarbij } F_{Z}(t) \text{continu is”}[/latex]

Centrale limietstelling: Voor de reeks van identiek verdeelde en onafhankelijke toevalsvariabelen X1,X2,……. die elk het gemiddelde μ en . hebben variantie σ2 dan de verdeling van de som

[latex]\frac{X_{1}+\cdots+X_{n}-n \mu}{\sigma \sqrt{n}}[/latex]

neigt naar de standaardnormaal als n neigt naar oneindig voor a om reële waarden te zijn

[latex]P\left\{\frac{X_{1}+\cdots+X_{n}-n \mu}{\sigma \sqrt{n}} \leq a\right\} \rightarrow \frac{1 }{\sqrt{2 \pi}} \int_{-\infty}^{a} e^{-x^{2} / 2} dx \quad \text { as } n \rightarrow \infty[/latex]

Bewijs: om het resultaat te bewijzen, beschouw het gemiddelde als nul en variantie als één, d.w.z μ=0 & σ2= 1 en de moment genererende functie voor Xi bestaat en is eindig, dus de momentgenererende functie voor de willekeurige variabele Xi/√n zal zijn

[latex]E\left[\exp \left\{\frac{t X_{i}}{\sqrt{n}}\right\}\right]=M\left(\frac{t}{\sqrt{ n}}\rechts)[/latex]

hier de momentgenererende functie voor de som ΣXi/√n zal zijn

[latex]\left[M\left(\frac{L}{\sqrt{n}}\right)\right]^{n} [/latex]

Laten we nu L(t)=logM(t) nemen

so

[latex]\begin{uitgelijnd}
L(0) &=0 \\
L^{\prime}(0) &=\frac{M^{\prime}(0)}{M(0)} \\
&=\mu \\
&=0 \\
L^{\priem \priem}(0) &=\frac{M(0) M^{\priem \priem}(0)-\links[M^{\priem}(0)\rechts]^{2 }}{[M(0)]^{2}} \\
&=E\links[X^{2}\rechts] \\
&=1
\end{uitgelijnd}[/latex]

om het bewijs te tonen dat we eerst laten zien

[latex][M(t / \sqrt{n})]^{n} \rightarrow e^{2^{2} / 2} \text{ as }n \rightarrow \infty[/latex]

door zijn equivalente vorm te tonen

[latex]n L(t / \sqrt{n}) \rechterpijl t^{2} / 2[/latex]

sinds

[latex]\begin{uitgelijnd}
\lim _{n \rightarrow \infty} \frac{L(t / \sqrt{n})}{n^{-1}}&=\lim _{n \rightarrow \infty} \frac{-L^ {\prime}(t / \sqrt{n}) n^{-3 / 2} t}{-2 n^{-2}} \quad \text{volgens de regel van L'Hôpital }\\
&=\lim _{n \rightarrow \infty}\left[\frac{L^{\prime}(t / \sqrt{n}) t}{2 n^{-1 / 2}}\right] \ \
&=\lim _{n \rightarrow \infty}\left[\frac{-L^{\prime \prime}(t / \sqrt{n}) n^{-3 / 2} t^{2}} {-2 n^{-3 / 2}}\right] \quad \text{ opnieuw volgens de regel van L'Hôpital }\\
&=\lim _{n \rightarrow \infty}\left[L^{\prime \prime}\left(\frac{t}{\sqrt{n}}\right) \frac{t^{2}} {2}\rechts] \\
&=\frac{t^{2}}{2}\end{aligned}[/latex]

vandaar dat dit het resultaat toont voor de gemiddelde nul en variantie 1, en hetzelfde resultaat volgt voor het algemene geval ook door te nemen

[latex]X_{i}^{*}=\left(X_{i}-\mu\right) / \sigma[/latex]

en voor elk hebben we

[latex]P\left\{\frac{X_{1}+\cdots+X_{n}-n \mu}{\sigma \sqrt{n}} \leq a\right\} \rightarrow \Phi(a )[/latex]

Voorbeeld van de centrale limietstelling

Om de afstand in lichtjaar van een ster vanaf het laboratorium van een astronoom te berekenen, gebruikt hij enkele meettechnieken, maar vanwege de verandering in de atmosfeer is de gemeten afstand elke keer niet exact, maar met een fout, dus om de exacte afstand te vinden die hij van plan is te vinden observeer continu in een reeks en het gemiddelde van deze afstanden als de geschatte afstand. Als hij de meetwaarden als identiek verdeelde en onafhankelijke willekeurige variabele met gemiddelde d en variantie 4 lichtjaar beschouwt, zoek dan het aantal metingen dat moet worden gedaan om de 0.5-fout te verkrijgen in de geschatte en werkelijke waarde?

Oplossing: Laten we de metingen beschouwen als de onafhankelijke willekeurige variabelen in volgorde X1,X2,…….Xn dus door de Centrale limietstelling we kunnen schrijven

[latex]Z_{n}=\frac{\sum_{i=1}^{n} X_{i}-nd}{2 \sqrt{n}}[/latex]

wat is de benadering in standaard normale verdeling dus de kans zal zijn

[latex]\links.\begin{array}{rl}
P\left\{-0.5 \leq \frac{\sum_{i=1}^{n} X_{i}}{n}-d \leq 0.5\right.
\end{array}\right\}=P\left\{-0.5 \frac{\sqrt{n}}{2} \leq Z_{n} \leq 0.5 \frac{\sqrt{n}}{2} \right\} \circa \Phi\left(\frac{\sqrt{n}}{4}\right)-\Phi\left(\frac{-\sqrt{n}}{4}\right)=2 \Phi\left(\frac{\sqrt{n}}{4}\right)-1[/latex]

dus om de nauwkeurigheid van de meting op 95 procent te krijgen, moet de astronoom n* afstanden meten waar

[latex]2 \Phi\left(\frac{\sqrt{n^{*}}}{4}\right)-1=0.95 \quad \text { or } \quad \Phi\left(\frac{\ sqrt{n^{*}}}{4}\right)=0.975[/latex]

dus vanuit de normale distributietabel kunnen we het schrijven als

[latex]\frac{\sqrt{n^{*}}}{4}=1.96 \quad \text { or } \quad n^{*}=(7.84)^{2} \circa 61.47[/latex]

waarin staat dat de meting 62 keer moet worden gedaan, dit kan ook worden waargenomen met behulp van De ongelijkheid van Chebyshev door te nemen

[latex]E\left[\sum_{i=1}^{n} \frac{X_{i}}{n}\right]=d \quad \operatorname{Var}\left(\sum_{i=1 }^{n} \frac{X_{i}}{n}\right)=\frac{4}{n}[/latex]

dus de ongelijkheid resulteert in

[latex]P\left\{\left|\sum_{i=1}^{n} \frac{X_{i}}{n}-d\right|>0.5\right\} \leq \frac{4 }{n(0.5)^{2}}=\frac{16}{n} [/latex]

vandaar voor n=16/0.05=320 wat de zekerheid geeft dat er slechts 5 procent fout zal zijn in de meting van de afstand van de ster tot het waarnemingslaboratorium.

2. Het aantal toegelaten studenten in de ingenieursopleiding is Poisson verdeeld met gemiddelde 100, er werd besloten dat als de toegelaten studenten 120 of meer zijn, het onderwijs in twee secties zal zijn, anders in slechts één sectie, wat is de kans dat er zijn twee secties voor de cursus?

Oplossing: door de Poisson-verdeling te volgen, wordt de exacte oplossing:

[latex]e^{-100} \sum_{i=120}^{\infty} \frac{(100)^{i}}{i !} [/latex]

wat duidelijk niet de specifieke numerieke waarde is, als we de willekeurige variabele X beschouwen zoals de studenten hebben toegelaten, dan door de centrale limietstelling

[latex]P\{X \geq 120\}=P\{X \cong 119.5\} [/latex]

die kunnen worden

[latex]\begin{array}{l}
=P\left\{\frac{X-100}{\sqrt{100}} \geq \frac{119.5-100}{\sqrt{100}}\right\} \\
\ongeveer 1-\Phi(1.95) \\
\ ongeveer 0.0256
\end{array} [/latex]

wat de numerieke waarde is.

3. Bereken de kans dat de som op tien dobbelstenen bij het werpen tussen 30 en 40 ligt, inclusief 30 en 40?

Oplossing: hier wordt de dobbelsteen als X . beschouwdi voor tien waarden van i. het gemiddelde en de variantie zullen zijn

[latex]E\left(X_{i}\right)=\frac{7}{2}, \quad \operatorname{Var}\left(X_{i}\right)=E\left[X_{i} ^{2}\right]-\left(E\left[X_{i}\right]\right)^{2}=\frac{35}{12} [/latex]

dus het volgen van de centrale limietstelling we kunnen schrijven

[latex]\begin{uitgelijnd}
P[29.5 \leq X \leq 40.5\} &=P\left\{\frac{29.5-35}{\sqrt{\frac{350}{12}}} \leq \frac{X-35}{\ sqrt{\frac{350}{12}}} \leq \frac{40.5-35}{\sqrt{\frac{350}{12}}}\right\} \\
& \ongeveer 2 \Phi(1.0184)-1 \\
& \ongeveer 0.692
\end{uitgelijnd} [/latex]

wat de vereiste kans is.

4. Voor de uniform verdeelde onafhankelijke stochastische variabelen Xi op het interval (0,1) wat is de benadering van de kans

[latex]P\left\{\sum_{i=1}^{10} X_{i}>6\right\} [/latex]

Oplossing: uit de Unifrom-verdeling weten we dat het gemiddelde en de variantie zullen zijn

[latex]E\left[X_{i}\right]=\frac{1}{2} \qquad \operatorname{Var}\left(X_{i}\right)=\frac{1}{12} [ /latex]

Gebruik nu de centrale limietstelling we kunnen

[latex]\begin{uitgelijnd}
P\left\{\sum_{1}^{10} X_{i}>6\right\} &=P\left\{\frac{\sum_{1}^{10} X_{i}-5}{\sqrt{10\left(\frac{1}{12}\right)}}>\frac{6-5}{\sqrt{10\left(\frac{1}{12}\right)}}\right\} \\
& \ongeveer 1-\Phi(\sqrt{1.2}) \\
& \ongeveer 0.1367
\end{uitgelijnd} [/latex]

dus de som van de willekeurige variabele zal 14 procent zijn.

5. Bereken de kans dat de beoordelaar van het examen een cijfer geeft, 25 examens vanaf 450 minuten als er 50 examens zijn waarvan de beoordelingstijd onafhankelijk is met een gemiddelde van 20 minuten en een standaarddeviatie van 4 minuten.

Oplossing: Houd rekening met de tijd die nodig is om het examen te beoordelen met de willekeurige variabele Xi dus de willekeurige variabele X zal zijn

[latex]X=\sum_{i=1}^{25} X_{i} [/latex]

aangezien deze taak voor 25-examen binnen 450 minuten duurt, dus

[latex]P\{X \leq 450\} [/latex]

[latex]E[X]=\sum_{i=1}^{25} E\left[X_{i}\right]=25(20)=500[/latex]

[latex]\operatornaam{Var}(X)=\sum_{i=1}^{25}\\
\operatornaam{Var}\left(X_{i}\right)=25(16)=400[/latex]

hier met behulp van de centrale limietstelling

[latex]\begin{uitgelijnd}
P[X \leq 450\} &=P\left(\frac{X-500}{\sqrt{400}} \leq \frac{450-500}{\sqrt{400}}\right) \\
& \ongeveer P(Z \leq-2.5\} \\
&=P(Z \geq 2.5\} \\
&=1-\Phi(2.5)=0.006
\end{uitgelijnd}[/latex]

wat de vereiste kans is.

Centrale limietstelling voor onafhankelijke willekeurige variabelen

Voor de rij die niet identiek is verdeeld maar met onafhankelijke willekeurige variabelen X1,X2,……. die elk het gemiddelde μ en variantie . hebben σ2 mits het voldoet

  1. elke Xi is uniform begrensd
  2. som van de varianties is oneindig, dan

[latex]P\left\{\frac{\sum_{i=1}^{n}\left(X_{i}-\mu_{i}\right)}{\sqrt{\sum_{i=1} ^{n} \sigma_{i}^{2}}} \simeq a\right\} \rightarrow \Phi(a) \quad \text { as } n \rightarrow \infty[/latex]

Sterke wet van de grote getallen

Sterke wet van grote getallen is een zeer cruciaal concept van de waarschijnlijkheidstheorie die zegt dat het gemiddelde van de reeks van algemeen verdeelde willekeurige variabelen met waarschijnlijkheid één zal convergeren naar het gemiddelde van diezelfde verdeling

verklaring: Voor de reeks van identiek verdeeld en onafhankelijke willekeurige variabelen X1,X2,……. die elk het eindige gemiddelde hebben met kans één dan

[latex]\frac{X_{1}+X_{2}+\cdots+X_{n}}{n} \rightarrow \mu \quad \text { as } \quad n \rightarrow \infty^{\dolk} [/latex]

Bewijs: om dit te bewijzen, bedenk dat het gemiddelde van elk van de willekeurige variabelen nul is, en de reeks

[latex]S_{n}=\sum_{i=1}^{n} X_{i}[/latex]

nu voor dit overweeg de kracht hiervan als

[latex]\begin{uitgelijnd}
E\left[S_{n}^{4}\right]=& E\left[\left(X_{1}+\cdots+X_{n}\right)\left(X_{1}+\cdots+ X_{n}\rechts)\rechts.\\
&\left.\times\left(X_{1}+\cdots+X_{n}\right)\left(X_{1}+\cdots+X_{n}\right)\right]
\end{uitgelijnd}[/latex]

na het nemen van de uitbreiding van de termen aan de rechterkant hebben we de voorwaarden van het formulier

[latex]X_{i}^{4}, \quad X_{i}^{3} X_{j}, \quad X_{i}^{2} X_{j}^{2}, \quad X_{ i}^{2} X_{j} X_{k}, \quad \quad X_{i} X_{j} X_{k} X_{l}[/latex]

aangezien dit onafhankelijken zijn, zal het gemiddelde hiervan zijn

[latex]\begin{uitgelijnd}
E\left[X_{i}^{3} X_{j}\right] &=E\left[X_{i}^{3}\right] E\left[X_{j}\right]=0 \ \
E\left[X_{i}^{2} X_{j} X_{k}\right] &=E\left[X_{i}^{2}\right] E\left[X_{j}\right ] E\links[X_{k}\rechts]=0 \\
E\links[X_{i} X_{j} X_{k} X_{l}\right] &=0 \\
\end{uitgelijnd}[/latex]

met behulp van de combinatie van het paar zal de uitbreiding van de serie nu zijn

[latex]\begin{uitgelijnd}
E\left[S_{n}^{4}\right] &=n E\left[X_{i}^{4}\right]+6\left(\begin{array}{l}
n \\
2
\end{array}\right) E\left[X_{i}^{2} X_{j}^{2}\right] \\
&=n K+3 n(n-1) E\left[X_{i}^{2}\right] E\left[X_{j}^{2}\right]
\end{uitgelijnd}[/latex]

sinds

[latex]0 \leq \operatorname{Var}\left(X_{i}^{2}\right)=E\left[X_{i}^{4}\right]-\left(E\left[X_{i}^{2}\right]\right)^{2}[/latex]

so

[latex]\left(E\left[X_{i}^{2}\right]\right)^{2} \leq E\left[X_{i}^{4}\right]=K[/latex ]

we krijgen

[latex]E\left[S_{n}^{4}\right] \leq n K+3 n(n-1) K[/latex]

dit suggereert de ongelijkheid

[latex]E\left[\frac{S_{n}^{4}}{n^{4}}\right] \leq \frac{K}{n^{3}}+\frac{3 K} {n^{2}}[/latex]

Vandaar

[latex]E\left[\sum_{n=1}^{\infty} \frac{s_{n}^{4}}{n^{4}}\right]=\sum_{n=1}^{\infty} E\left[\frac{s_{n}^{4}}{n^{4}}\right]<\infty[/latex]

Door de convergentie van de reeks, aangezien de kans op elke willekeurige variabele één is

[latex]\lim _{n \rightarrow \infty} \frac{S_{n}^{4}}{n^{4}}=0[/latex]

sinds

[latex]\frac{S_{n}}{n} \rightarrow 0 \quad \text { as } \quad n \rightarrow \infty[/latex]

als het gemiddelde van elke willekeurige variabele niet gelijk is aan nul, dan kunnen we het met afwijking en kans één schrijven als

[latex]\lim _{n \rightarrow \infty} \sum_{i=1}^{n} \frac{\left(X_{i}-\mu\right)}{n}=0[/latex]

or

[latex]\lim _{n \rightarrow \infty} \sum_{i=1}^{n} \frac{X_{i}}{n}=\mu[/latex]

wat het gewenste resultaat is.

Eenzijdige Chebyshev-ongelijkheid

De eenzijdige Chebysheve-ongelijkheid voor de willekeurige variabele X met gemiddelde nul en eindige variantie als a>0 is

De ongelijkheid van Chebyshev
chebyshev ongelijkheid

om dit te bewijzen, overweeg voor b>0 laat de willekeurige variabele X as

[latex]X \geq a \text{ is gelijk aan } X+b \geq a+b[/latex]

wat geeft

[latex]P[X \geq a]=P[X+b \geq a+b]\\
\leq P[(X+b)^{2} \geq (a+b)^{2}]
[/latex]

dus met behulp van de Markovs ongelijkheid

De ongelijkheid van Chebyshev
eenzijdige chebyshev

wat de vereiste ongelijkheid oplevert. voor het gemiddelde en de variantie kunnen we het schrijven als

[latex]P(X-\mu \geq a\} \leq \frac{\sigma^{2}}{\sigma^{2}+a^{2}}
\\P(\mu-X \geq a\} \leq \frac{\sigma^{2}}{\sigma^{2}+a^{2}}[/latex]

Dit kan verder worden geschreven als

[latex]\begin{array}{l}
P(X \geq \mu+a\} \leq \frac{\sigma^{2}}{\sigma^{2}+a^{2}} \\
P\{X \leq \mu-a\} \leq \frac{\sigma^{2}}{\sigma^{2}+a^{2}}
\end{array}[/latex]

Voorbeeld:

Zoek de bovengrens van de kans dat de productie van het bedrijf dat willekeurig wordt verdeeld ten minste 120 zal zijn, als de productie van dit bepaalde bedrijf gemiddelde 100 en variantie 400 heeft.

Oplossing:

De eenzijdige gebruiken chebyshev ongelijkheid

[latex]P\{X \geq 120\}=P(X-100 \geq 20\} \leq \frac{400}{400+(20)^{2}}=\frac{1}{2} [/latex]

dus dit geeft de kans op de productie binnen een week minstens 120 is 1/2, nu wordt de grens voor deze kans verkregen door gebruik te maken van Markovs ongelijkheid

[latex]P[X \geq 120\} \leq \frac{E(X)}{120}=\frac{5}{6}[/latex]

die de bovengrens voor de kans aangeeft.

Voorbeeld:

Honderd paren worden genomen uit tweehonderd personen met honderd mannen en honderd vrouwen vinden de bovengrens van de kans dat hoogstens dertig paar een man en een vrouw zullen zijn.

Oplossing:

Laat de willekeurige variabele Xi as

[latex]X_{i}=\left\{\begin{array}{ll}1 & \text { if man i is paired with a woman} \\ 0 & \text { anders }\end{array}\right .[/latex]

dus het paar kan worden uitgedrukt als

[latex]X=\sum_{i=1}^{100} X_{i}[/latex]

Aangezien elke man even waarschijnlijk een paar kan zijn met de overige mensen waarin honderd vrouwen zijn, dus het gemiddelde

[latex]E\left[X_{i}\right]=P\left\{X_{i}=1\right\}=\frac{100}{199}[/latex]

op dezelfde manier als i en j niet gelijk zijn dan

[latex]\begin{uitgelijnd}
E\left[X_{i} X_{j}\right] &=P\left\{X_{i}=1, X_{j}=1\right\} \\
&=P\left\{X_{i}=1\right\} P\left[X_{j}=1 \mid X_{i}=1\right\}=\frac{100}{199} \frac {99}{197}
\end{uitgelijnd}[/latex]

as

[latex]P\left\{X_{j}=1 \mid X_{i}=1\right\}=99 / 197[/latex]

daarom hebben we

[latex]begin{uitgelijnd}
E[X] &=\sum_{i=1}^{100} E\left[X_{i}\right] \\
&=(100) \frac{100}{199} \\
& \ongeveer 50.25 \\
\operatornaam{Var}(X) &=\sum_{i=1}^{100} \operatornaam{Var}\left(X_{i}\right)+2 \sum_{i
&=100 \frac{100}{199} \frac{99}{199}+2\left(\begin{array}{c}
100 \\
2
\end{array}\right)\left[\frac{100}{199} \frac{99}{197}-\left(\frac{100}{199}\right)^{2}\right] \\
& \ongeveer 25.126
\end{uitgelijnd}[/latex]

met de chebyshev ongelijkheid

[latex]P\{X \leq 30\} \leq P\{|X-50.25| \geq 20.25\} \leq \frac{25.126}{(20.25)^{2}} \circa 0.061[/latex]

wat aangeeft dat de mogelijkheid om 30 mannen aan vrouwen te koppelen minder dan zes is, dus we kunnen de binding verbeteren door gebruik te maken van eenzijdige chebyshev-ongelijkheid

[latex]\begin{uitgelijnd}
P[X \leq 30\} &=P[X \leq 50.25-20.25\rangle \\
& \leq \frac{25.126}{25.126+(20.25)^{2}} \\
& \ongeveer 0.058
\end{uitgelijnd}[/latex]

Chernoff Bound B

Als de momentgenererende functie al bekend is, dan

[latex]\begin{uitgelijnd}
P[X \geq a\}&=P\left(e^{\ell X} \geq e^{\downarrow a}\right)\\
&\leq E\left[e^{t X}\right] e^{-ta}
\end{uitgelijnd}[/latex]

as

[latex]M(t)=E\links[e^{LX}\rechts][/latex]

op dezelfde manier kunnen we voor t<0 schrijven als

[latex]\begin{uitgelijnd}
P\{X \leq a\} &=P\left\{e^{IX} \geq e^{[\alpha}\right\} \\
& \leq E\left[e^{t X}\right] e^{-ta}
\end{uitgelijnd}[/latex]

Dus de Chernoff-grens kan worden gedefinieerd als

[latex]\begin{array}{ll}
P\{X \geq a\} \leq e^{-f \tau} M(t) & \text { for all } t>0 \\
P\{X \leq a\} \leq e^{-\pi \tau} M(t) & \text { voor alle } t<0
\end{array}[/latex]

deze ongelijkheid staat voor alle waarden van t, zowel positief als negatief.

Chernoff-grenzen voor de standaard normale willekeurige variabele

De grenzen van Chernoff voor de norm normale willekeurige variabele wiens momentgenererende functie

[latex]M(t)=e^{e^{2} / 2}[/latex]

is

[latex]P\{Z \geq a\rangle \leq e^{-ta} e^{t^{2} / 2} \quad \text { for all } \quad t>0[/latex]

dus het minimaliseren van deze ongelijkheid en machtstermen aan de rechterkant geeft a> 0

[latex]P\{Z \geq a\} \simeq e^{-\lambda^{2} / 2}[/latex]

en voor a<0 is het

[latex]P\{Z \leq a\} \leqq e^{-\alpha^{2} / 2}[/latex]

Chernoff-grenzen voor de willekeurige variabele van Poisson

De Chernoff-grenzen voor de willekeurige variabele van Poisson waarvan de momentgenererende functie

[latex]M(t)=e^{\lambda\left(e^{\prime}-1\right)}[/latex]

is

[latex]P\{X \geq i\} \leq e^{\lambda\left(e^{t}-1\right)} e^{-it} \quad t>0[/latex]

dus het minimaliseren van deze ongelijkheid en machtstermen aan de rechterkant geeft a> 0

[latex]P\{X \geq i\} \leq e^{\lambda \omega / \lambda-1)}\left(\frac{\lambda}{i}\right)[/latex]

en het zou zijn

[latex]P\{X \geq i\} \leq \frac{e^{-2}(e \lambda)^{i}}{l^{i}}[/latex]

Voorbeeld op Chernoff Bounds

Als een speler in een spel evenveel kans heeft om het spel te winnen of te verliezen, onafhankelijk van een eerdere score, bepaal dan de chernoff voor de waarschijnlijkheid

Oplossing: laat Xi duiden het winnen van de speler aan, dan is de kans

[latex]P\left\{X_{i}=1\right\}=P\left\{X_{i}=-1\right\}=\frac{1}{2}[/latex]

voor de reeks van n speelt let

[latex]S_{n}=\sum_{i=1}^{n} X_{i}[/latex]

dus de momentgenererende functie zal zijn

[latex]E\left[e^{\ell X}\right]=\frac{e^{t}+e^{-t}}{2}[/latex]

hier met behulp van de uitbreidingen van exponentiële termen

[latex]\begin{uitgelijnd}
e^{I}+e^{-l} &=1+t+\frac{t^{2}}{2 !}+\frac{t^{3}}{3 !}+\cdots+\left( 1-t+\frac{t^{2}}{2 !}-\frac{t^{3}}{3 !}+\cdots\right) \\
&=2\left\{1+\frac{t^{2}}{2 !}+\frac{t^{4}}{4 !}+\cdots\right\} \\
&=2 \sum_{n=0}^{\infty} \frac{t^{2 n}}{(2 n) !} \\
& \simeq 2 \sum_{n=0}^{\infty} \frac{\left(t^{2} / 2\right)^{n}}{n !} \quad \operatorname{sinds}(2 n) ! \geq n ! 2^{n} \\
&=2 e^{t^{2} / 2}
\end{uitgelijnd}[/latex]

Dus we hebben

[latex]E\left[e^{t X}\right] \geq e^{t^{2} / 2}[/latex]

nu de eigenschap van de momentgenererende functie toepassen

[latex]\begin{uitgelijnd}
E\left[e^{\mathcal{S}_{n}}\right] &=\left(E\left[e^{LX}\right]\right)^{n} \\
& \leq e^{n^{2} / 2}
\end{uitgelijnd}[/latex]

Dit geeft de ongelijkheid

[latex]P\left\{S_{n} \geq a\right\} \leq e^{-\alpha^{2} / 2 n} \quad a>0[/latex]

Vandaar

[latex]P\left\{S_{10} \geq 6\right\} \leq e^{-36 / 20} \circa 0.1653[/latex]

Conclusie:

De ongelijkheden en de limietstelling voor de grote getallen werden besproken en de gerechtvaardigde voorbeelden voor de grenzen van de kansen werden ook genomen om een ​​glimp van het idee op te vangen. het concept gemakkelijk, als u verder wilt lezen, ga dan door onderstaande boeken of voor meer artikelen over waarschijnlijkheid, volg onze Wiskunde pagina's.

Een eerste kanscursus door Sheldon Ross

Schaum's contouren van waarschijnlijkheid en statistiek

Een inleiding tot kansrekening en statistiek door ROHATGI en SALEH

dr. MOHAMMED MAZHAR UL HAQUE

Ik ben DR. Mohammed Mazhar Ul Haque, assistent-professor in de wiskunde. Met 12 jaar ervaring in het lesgeven. Grote kennis hebben in zuivere wiskunde, precies op algebra. Het enorme vermogen hebben om problemen te ontwerpen en op te lossen. Kan kandidaten motiveren om hun prestaties te verbeteren. Ik draag graag bij aan Lambdageeks om wiskunde eenvoudig, interessant en zelfverklarend te maken voor zowel beginners als experts. Laten we verbinding maken via LinkedIn - https://www.linkedin.com/in/dr-mohammed-mazhar-ul-haque-58747899/

Recente Nieuws