Erwartungswert

Der Erwartungswert (selten und doppeldeutig Mittelwert), der oft mit $\mu$ abgekürzt wird, ist ein Grundbegriff der Stochastik. Der Erwartungswert einer Zufallsvariablen beschreibt die Zahl, die die Zufallsvariable im Mittel annimmt. Er ergibt sich zum Beispiel bei unbegrenzter Wiederholung des zugrunde liegenden Experiments als Durchschnitt der Ergebnisse. Das Gesetz der großen Zahlen beschreibt, in welcher Form genau die Durchschnitte der Ergebnisse bei wachsender Anzahl der Experimente gegen den Erwartungswert streben, oder anders gesagt, wie die Stichprobenmittelwerte bei wachsender Stichprobengröße gegen den Erwartungswert konvergieren.

Er bestimmt die Lokalisation (Lage) der Verteilung der Zufallsvariablen und ist vergleichbar mit dem empirischen arithmetischen Mittel einer Häufigkeitsverteilung in der deskriptiven Statistik, jedoch mit einem wichtigen Unterschied: Der Erwartungswert ist der "wahre" Mittelwert einer Zufallsvariablen (Mittelwert der Grundgesamtheit), während sich das arithmetische Mittel in der Regel nur auf eine Stichprobe von Werten bezieht (Stichprobenmittel). Eine neue Stichprobe wird einen unterschiedlichen arithmetischen Mittelwert liefern, jedoch der Erwartungswert $\mu$ bleibt immer gleich.

Er berechnet sich als nach Wahrscheinlichkeit gewichtetes Mittel der Werte, die die Zufallsvariable annimmt. Er muss selbst jedoch nicht einer dieser Werte sein. Insbesondere kann der Erwartungswert die Werte $\pm \infty$ annehmen.

Weil der Erwartungswert nur von der Wahrscheinlichkeitsverteilung abhängt, wird vom Erwartungswert einer Verteilung gesprochen, ohne Bezug auf eine Zufallsvariable. Der Erwartungswert einer Zufallsvariablen kann als Schwerpunkt der Wahrscheinlichkeitsmasse betrachtet werden und wird daher als ihr erstes Moment bezeichnet.

Motivation

Die Augenzahlen beim Würfelwurf können als unterschiedliche Ausprägungen einer Zufallsvariablen $X$ betrachtet werden. Weil die (tatsächlich beobachteten) relativen Häufigkeiten sich gemäß dem Gesetz der großen Zahlen mit wachsendem Stichprobenumfang $n$ den theoretischen Wahrscheinlichkeiten der einzelnen Augenzahlen annähern, muss der Mittelwert gegen den Erwartungswert von $X$ streben. Zu dessen Berechnung werden die möglichen Ausprägungen mit ihrer theoretischen Wahrscheinlichkeit gewichtet.

{\begin{array}{lcl}\operatorname {E} (X)&=&1\cdot P(X=1)+2\cdot P(X=2)+3\cdot P(X=3)+4\cdot P(X=4)+5\cdot P(X=5)+6\cdot P(X=6)\\&=&(1+2+3+4+5+6)\cdot {\tfrac {1}{6}}=3{,}5.\end{array}}

Wie die Ergebnisse der Würfelwürfe ist der Mittelwert vom Zufall abhängig. Im Unterschied dazu ist der Erwartungswert eine feste Kennzahl der Verteilung der Zufallsvariablen $X$ .

Die Definition des Erwartungswerts steht in Analogie zum gewichteten Mittelwert von empirisch beobachteten Zahlen. Hat zum Beispiel eine Serie von zehn Würfelversuchen die Ergebnisse 4, 2, 1, 3, 6, 3, 3, 1, 4, 5 geliefert, kann der zugehörige Mittelwert

{\bar {x}}=(4+2+1+3+6+3+3+1+4+5)\cdot {\tfrac {1}{10}}=3{,}2

alternativ berechnet werden, indem zunächst gleiche Werte zusammengefasst und nach ihrer relativen Häufigkeit gewichtet werden:

{\bar {x}}={\tfrac {2}{10}}\cdot 1+{\tfrac {1}{10}}\cdot 2+{\tfrac {3}{10}}\cdot 3+{\tfrac {2}{10}}\cdot 4+{\tfrac {1}{10}}\cdot 5+{\tfrac {1}{10}}\cdot 6=3{,}2

.

Allgemein lässt der Mittelwert der Augenzahlen in $n$ Würfen sich wie

1\cdot h_{n}(1)+2\cdot h_{n}(2)+3\cdot h_{n}(3)+4\cdot h_{n}(4)+5\cdot h_{n}(5)+6\cdot h_{n}(6),

schreiben, worin $h_{n}(k)$ die relative Häufigkeit der Augenzahl $k$ bezeichnet.

Begriff und Notation

Begriff

Das Konzept des Erwartungswertes geht auf Christiaan Huygens zurück. In einer Abhandlung über Glücksspiele von 1656, „Van rekeningh in spelen van geluck“ bezeichnet Huygens den erwarteten Gewinn eines Spiels als „het is my soo veel weerdt“. Frans van Schooten verwendete in seiner Übersetzung von Huygens' Text ins Lateinische den Begriff expectatio. Bernoulli übernahm in seiner Ars conjectandi den von van Schooten eingeführten Begriff in der Form valor expectationis.^[1]

Notation

Das Symbol E für Erwartungswert oder Expectation wurde in der englischsprachigen Literatur erst ab dem 20. Jahrhundert eingeführt.^[2] Heute wird in der englischsprachigen und deutschsprachigen mathematischen Literatur häufig die Schreibweise $\operatorname {E} \left(X\right)$ oder $\mathbb {E} \left(X\right)$ oder auch mit eckigen Klammern $\operatorname {E} \left[X\right]$ bzw. $\mathbb {E} \left[X\right]$ für den Erwartungswert der Zufallsvariable $X$ verwendet.^[3]^[4] Gelegentlich werden auch geschweiften Klammern verwendet.^[5]

In der russischsprachigen Literatur findet sich die Bezeichnung $M(X)$ .^[6]

Gelegentlich werden auch die Klammern um die Zufallsvariable weggelassen, was der Schreibweise für Operatoren entspricht: $\operatorname {\it {E}} X$ oder $\operatorname {\it {M}} X$ .^[7] Mit der auch vorkommenden Notation $\mathbb {E} X$ besteht hierbei nicht die Gefahr, dass der Operator $\mathbb {E}$ mit einer Zufallsvariable verwechselt wird. Die Notation $\operatorname {E} \left[X\right]$ mit den eckigen Klammern hebt speziell die Tatsache hervor, dass es sich hier um ein Funktional handelt.

Die Bezeichnung $\mu _{X}$ des Erwartungswerts der Zufallsvariable $X$ betont die Eigenschaft als nicht vom Zufall abhängiges erstes Moment. In der Physik findet die Bra-Ket-Notation Verwendung.^[8] Insbesondere wird $\langle X\rangle$ statt $\operatorname {E} (X)$ für den Erwartungswert einer Größe $X$ geschrieben.

Definitionen

Ist eine Zufallsvariable diskret oder besitzt sie eine Dichte, so existieren die folgenden Formeln für den Erwartungswert.

Erwartungswert einer diskreten reellen Zufallsvariable

Im reellen diskreten Fall errechnet sich der Erwartungswert als die Summe der Produkte aus den Wahrscheinlichkeiten jedes möglichen Ergebnisses des Experiments und den „Werten“ dieser Ergebnisse.

Ist $X$ eine reelle diskrete Zufallsvariable, die die Werte $(x_{i})_{i\in I}$ mit den jeweiligen Wahrscheinlichkeiten $(p_{i})_{i\in I}$ annimmt (mit $I$ als abzählbarer Indexmenge), so errechnet sich der Erwartungswert $\operatorname {E} (X)$ im Falle der Existenz mit:

\operatorname {E} (X)=\sum _{i\in I}x_{i}p_{i}=\sum _{i\in I}x_{i}P(X=x_{i})

Es ist zu beachten, dass dabei nichts über die Reihenfolge der Summation ausgesagt wird (siehe summierbare Familie).

Ist $I=\mathbb {N}$ , so besitzt $X$ genau dann einen endlichen Erwartungswert $\operatorname {E} (X)$ , wenn die Konvergenzbedingung

\lim _{a\rightarrow \infty }\sum _{i=1}^{a}|x_{i}|p_{i}=\sum _{i=1}^{\infty }|x_{i}|p_{i}<\infty

erfüllt ist, d. h. die Reihe für den Erwartungswert absolut konvergent ist.

Für nichtnegative ganzzahlige Zufallsvariablen ist oft die folgende Eigenschaft hilfreich^[9]

\operatorname {E} (X)=\sum \limits _{i=1}^{\infty }P(X\geq i).

Diese Eigenschaft wird im Abschnitt über den Erwartungswert einer nicht-negativen Zufallsvariablen bewiesen.

Erwartungswert einer reellen Zufallsvariable mit Dichtefunktion

File:Beta first moment.svg

Der Erwartungswert balanciert die Wahrscheinlichkeitsmasse – hier die Masse unter der Dichte einer Beta(α,β)-Verteilung mit Erwartungswert α/(α+β). Dies entspricht der Interpretation des Erwartungswertes als Massenmittelpunkt.

Hat eine reelle Zufallsvariable $X$ eine Wahrscheinlichkeitsdichtefunktion $f$ , das heißt hat das Bildmaß $P^{X}$ diese Dichte bezüglich des Lebesgue-Maßes $\lambda$ , so berechnet sich der Erwartungswert im Falle der Existenz als

(1)

\displaystyle \quad \operatorname {E} (X)=\int _{\mathbb {R} }xf(x)\,\mathrm {d} \lambda (x).

In vielen Anwendungsfällen liegt (im Allgemeinen uneigentliche) Riemann-Integrierbarkeit vor und es gilt:

(2)

\displaystyle \quad \operatorname {E} (X)=\int _{-\infty }^{\infty }xf(x)\,\mathrm {d} x.

Gleichwertig zu dieser Gleichung ist, wenn $F$ Verteilungsfunktion von $X$ ist:

(3)

\displaystyle \quad \operatorname {E} (X)=\int _{0}^{\infty }(1-F(x))\,\mathrm {d} x-\int _{-\infty }^{0}F(x)\,\mathrm {d} x.

(2) und (3) sind unter der gemeinsamen Voraussetzung ( $f$ ist Dichtefunktion und $F$ ist Verteilungsfunktion von $X$ ) äquivalent, was mit schulgemäßen Mitteln bewiesen werden kann.^[10]

Für nichtnegative Zufallsvariablen folgt daraus die wichtige Beziehung zur Zuverlässigkeitsfunktion $R(t)=1-F(t)$

\operatorname {E} (X)=\int _{0}^{\infty }(1-F(t))\,\mathrm {d} t=\int _{0}^{\infty }R(t)\,\mathrm {d} t.

Allgemeine Definition

Der Erwartungswert wird entsprechend als das Lebesgue-Integral bezüglich des Wahrscheinlichkeitsmaßes definiert: Ist $X$ eine bezüglich dem Maß $P$ integrierbare oder quasiintegrierbare Zufallsvariable auf einem Wahrscheinlichkeitsraum $(\Omega ,\Sigma ,P)$ mit Werten in $({\overline {\mathbb {R} }},{\mathcal {B}})$ , wobei ${\mathcal {B}}$ die Borelsche σ-Algebra über ${\overline {\mathbb {R} }}:=\mathbb {R} \cup \{-\infty ,\infty \}$ ist, so wird definiert

\operatorname {E} (X)=\int _{\Omega }X\,\mathrm {d} P=\int _{\Omega }X(\omega )\mathrm {d} P(\omega )\,

.

Die Zufallsvariable $X$ besitzt genau dann einen Erwartungswert, wenn sie quasiintegrierbar ist, also die Integrale

\int _{\Omega }X^{+}(\omega )\,\mathrm {d} P(\omega )

und

\int _{\Omega }X^{-}(\omega )\,\mathrm {d} P(\omega )

nicht beide unendlich sind, wobei $X^{+}$ und $X^{-}$ den Positiv- sowie den Negativteil von $X$ bezeichnen. In diesem Fall kann $\operatorname {E} (X)=\infty$ oder $\operatorname {E} (X)=-\infty$ gelten.

Der Erwartungswert ist genau dann endlich, wenn $X$ integrierbar ist, also die obigen Integrale über $X^{+}$ und $X^{-}$ beide endlich sind. Dies ist äquivalent mit

\int _{\Omega }|X(\omega )|\,\mathrm {d} P(\omega )<\infty .

In diesem Fall schreiben viele Autoren, der Erwartungswert existiere oder $X$ sei eine Zufallsvariable mit existierendem Erwartungswert, und schließen damit den Fall $\infty$ bzw. $-\infty$ aus.

Erwartungswert von zwei Zufallsvariablen mit gemeinsamer Dichtefunktion

Haben die integrierbaren Zufallsvariablen $X$ und $Y$ eine gemeinsame Wahrscheinlichkeitsdichtefunktion $f(x,y)$ , so berechnet sich der Erwartungswert einer Funktion $g(X,Y)$ von $X$ und $Y$ nach dem Satz von Fubini zu

\operatorname {E} (g(X,Y))=\int _{-\infty }^{\infty }\int _{-\infty }^{\infty }g(x,y)f(x,y)\,\mathrm {d} x\,\mathrm {d} y

Der Erwartungswert von $g(X,Y)$ ist nur dann endlich, wenn das Integral

\int _{-\infty }^{\infty }\int _{-\infty }^{\infty }\left|g(x,y)\right|f(x,y)\,\mathrm {d} x\,\mathrm {d} y

endlich ist.

Insbesondere ist:

\operatorname {E} (X)=\int _{-\infty }^{\infty }\int _{-\infty }^{\infty }xf(x,y)\,\mathrm {d} x\,\mathrm {d} y

Aus der Randdichte errechnet sich der Erwartungswert wie bei univariaten Verteilungen:

\operatorname {E} (X)=\int _{-\infty }^{\infty }xf_{X}(x)\,\mathrm {d} x

Dabei ist die Randdichte $f_{X}(x)$ gegeben durch

f_{X}(x)=\int _{-\infty }^{\infty }f(x,y)\,\mathrm {d} y

Elementare Eigenschaften

Linearität

Der Erwartungswert ist linear, es gilt also für beliebige, nicht notwendigerweise unabhängige Zufallsvariablen $X_{1},X_{2}$ , dass

\operatorname {E} (aX_{1}+bX_{2})=a\operatorname {E} (X_{1})+b\operatorname {E} (X_{2})

ist. Als Spezialfälle ergeben sich

\operatorname {E} (cX+d)=c\operatorname {E} (X)+d

,

\operatorname {E} (cX)=c\operatorname {E} (X)

und

\operatorname {E} (d)=d

.

Die Linearität lässt sich auch auf endliche Summen erweitern:

\operatorname {E} \left(\sum _{i=1}^{n}X_{i}\right)=\sum _{i=1}^{n}\operatorname {E} (X_{i})

Die Linearität des Erwartungswertes folgt aus der Linearität des Integrals.

Monotonie

Ist $X\leq Y$ fast sicher, und existieren $\operatorname {E} (X),\operatorname {E} (Y)$ , so gilt

\operatorname {E} (X)\leq \operatorname {E} (Y)

.

Wahrscheinlichkeiten als Erwartungswerte

Wahrscheinlichkeiten von Ereignissen lassen sich auch über den Erwartungswert ausdrücken. Für jedes Ereignis $A$ gilt

\operatorname {P} (A)=\operatorname {E} (\chi _{A})\,

,

wobei $\chi _{A}$ die Indikatorfunktion von $A$ ist.

Dieser Zusammenhang ist oft nützlich, etwa zum Beweis der Tschebyschow-Ungleichung.

Dreiecksungleichung

Es gilt

\left|\operatorname {E} (X)\right|\leq \operatorname {E} (|X|)

und

\operatorname {E} (|X+Y|)\leq \operatorname {E} (|X|)+\operatorname {E} (|Y|)

Beispiele

Würfeln

File:Largenumbers.svg

Eine Illustration der Konvergenz von Durchschnitten des Würfelns eines Würfels zum Erwartungswert von 3,5, wenn die Anzahl an Versuchen steigt.

Das Experiment sei ein Würfelwurf. Als Zufallsvariable $X$ betrachten wir die gewürfelte Augenzahl, wobei jede der Zahlen 1 bis 6 mit einer Wahrscheinlichkeit von jeweils 1/6 gewürfelt wird.

\operatorname {E} (X)=\sum _{i=1}^{6}i\cdot {\frac {1}{6}}=3{,}5

Wenn beispielsweise 1000-mal gewürfelt wird, man also das Zufallsexperiment 1000-mal wiederholt und die geworfenen Augenzahlen zusammenzählt und durch 1000 dividiert, ergibt sich mit hoher Wahrscheinlichkeit ein Wert in der Nähe von 3,5. Es ist jedoch unmöglich, diesen Wert mit einem einzigen Würfelwurf zu erzielen.

Sankt-Petersburg-Paradoxon

Das Sankt-Petersburg-Paradoxon beschreibt ein Glücksspiel, dessen zufälliger Gewinn $X$ einen unendlichen Erwartungswert hat. Gemäß der klassischen Entscheidungstheorie, die auf der Erwartungswertregel $X\succcurlyeq Y\Leftrightarrow \operatorname {E} (X)\geq \operatorname {E} (Y)$ basiert, sollte man daher einen beliebig hohen Einsatz riskieren. Da die Wahrscheinlichkeit für einen Verlust des Einsatzes aber $50\%$ beträgt, erscheint diese Empfehlung nicht rational. Eine Lösung des Paradoxons stellt die Verwendung einer logarithmischen Nutzenfunktion dar.

Zufallsvariable mit Dichte

Gegeben ist die reelle Zufallsvariable $X$ mit der Dichtefunktion

f(x)={\begin{cases}{\frac {1}{x}},&3\leq x\leq 3\mathrm {e} ,\\&\\0,&{\text{sonst}}\end{cases}}

wobei $\mathrm {e}$ die Eulersche Konstante bezeichnet.

Der Erwartungswert von $X$ berechnet sich als

{\begin{aligned}\operatorname {E} (X)&=\int _{-\infty }^{\infty }xf(x)\,\mathrm {d} x=\int _{-\infty }^{3}x\cdot 0\,\mathrm {d} x+\int _{3}^{3\mathrm {e} }x\cdot {\frac {1}{x}}\,\mathrm {d} x+\int _{3\mathrm {e} }^{\infty }x\cdot 0\,\mathrm {d} x\\&=0+\int _{3}^{3\mathrm {e} }1\,\mathrm {d} x+0=[x]_{3}^{3\mathrm {e} }=3\mathrm {e} -3=3(\mathrm {e} -1).\end{aligned}}

Allgemeine Definition

Gegeben sei der Wahrscheinlichkeitsraum $(\Omega ,\Sigma ,P)$ mit $\Omega =\{\omega _{1},\omega _{2},\omega _{3}\}$ , $\Sigma$ die Potenzmenge von $\Omega$ und $P(\{\omega _{i}\})={\tfrac {1}{3}}$ für $i=1,2,3$ . Der Erwartungswert der Zufallsvariablen $X\colon \Omega \to \mathbb {R}$ mit $X(\omega _{1})=X(\omega _{2})=1$ und $X(\omega _{3})=2$ ist

\operatorname {E} (X)=\int _{\Omega }X\,\mathrm {d} P=X(\omega _{1})P(\{\omega _{1}\})+X(\omega _{2})P(\{\omega _{2}\})+X(\omega _{3})P(\{\omega _{3}\})=1\cdot {\frac {1}{3}}+1\cdot {\frac {1}{3}}+2\cdot {\frac {1}{3}}={\frac {4}{3}}

Da $X$ eine diskrete Zufallsvariable ist mit $P(X=1)=P(\{\omega _{1},\omega _{2}\})={\tfrac {2}{3}}$ und $P(X=2)=P(\{\omega _{3}\})={\tfrac {1}{3}}$ , kann der Erwartungswert alternativ auch berechnet werden als

\operatorname {E} (X)=1\cdot P(X=1)+2\cdot P(X=2)=1\cdot {\frac {2}{3}}+2\cdot {\frac {1}{3}}={\frac {4}{3}}

Weitere Eigenschaften

Erwartungswert einer nicht-negativen Zufallsvariable

Falls $p>0$ ist und $X\in L^{p}$ fast sicher nicht-negativ ist, so gilt gemäß dem Satz von Fubini-Tonelli (hierbei bezeichnen die eckigen Klammern die Prädikatabbildung)

\operatorname {E} (X^{p})=\int _{\Omega }X(\omega )^{p}\,\mathrm {d} P(\omega )=\int _{\Omega }\int _{0}^{\infty }px^{p-1}[x\leq X(\omega )]\,\mathrm {d} x\,\mathrm {d} P(\omega )=\int _{0}^{\infty }\int _{\Omega }px^{p-1}[x\leq X(\omega )]\,\mathrm {d} P(\omega )\,\mathrm {d} x=p\int _{0}^{\infty }x^{p-1}P{\big (}\{\omega \in \Omega \mid x\leq X(\omega )\}{\big )}\,\mathrm {d} x

Also ist

\operatorname {E} (X^{p})=p\int _{0}^{\infty }x^{p-1}P(X\geq x)\,\mathrm {d} x=p\int _{0}^{\infty }x^{p-1}P(X>x)\,\mathrm {d} x.

(Die letzte Gleichheit ist richtig, da $P(X=x)=0$ für fast alle $x\in \mathbb {R}$ .)

Für $p=1$ ergibt sich der folgende bekannte Spezialfall:

\operatorname {E} (X)=\int _{0}^{\infty }P(X\geq x)\,\mathrm {d} x=\int _{0}^{\infty }P(X>x)\,\mathrm {d} x.

Für ganzzahlige, nichtnegative Zufallsvariablen gilt also wegen

\int _{n}^{n+1}P(X>x)\,\mathrm {d} x=P(X\geq n+1)

die oben genannte Formel:

\operatorname {E} (X)=\sum _{i=0}^{\infty }\int _{i}^{i+1}P(X>x)\,\mathrm {d} x=\sum _{i=0}^{\infty }P(X\geq i+1)=\sum _{i=1}^{\infty }P(X\geq i).

Sigma-Additivität

Sind alle Zufallsvariablen $(X_{i})_{i\in \mathbb {N} }$ fast sicher nichtnegativ, so lässt sich die endliche Additivität sogar zur $\sigma$ -Additivität erweitern:

\operatorname {E} \left(\sum _{i=1}^{\infty }X_{i}\right)=\sum _{i=1}^{\infty }\operatorname {E} (X_{i})

Erwartungswert des Produkts von n stochastisch unabhängigen Zufallsvariablen

Wenn die Zufallsvariablen $X_{i}$ stochastisch voneinander unabhängig und integrierbar sind, gilt:

\operatorname {E} \!\left(\prod _{i=1}^{n}X_{i}\right)=\prod _{i=1}^{n}\operatorname {E} (X_{i})

insbesondere auch

\operatorname {E} \!\left(X_{i}X_{j}\right)=\operatorname {E} \!\left(X_{i}\right)\cdot \operatorname {E} \!\left(X_{j}\right)

für

i\neq j

Erwartungswert des Produkts von nicht stochastisch unabhängigen Zufallsvariablen

Falls die Zufallsvariablen $X$ und $Y$ nicht stochastisch unabhängig sind, gilt für deren Produkt:

\operatorname {E} \!\left(XY\right)=\operatorname {E} \!\left(X\right)\operatorname {E} \!\left(Y\right)+\operatorname {Cov} \!\left(X,Y\right)

Dabei ist $\operatorname {Cov} \!\left(X,Y\right)$ die Kovarianz zwischen $X$ und $Y$ .

Erwartungswert einer zusammengesetzten Zufallsvariable

Ist $Y$ eine zusammengesetzte Zufallsvariable, sprich sind $N,X_{1},X_{2},\dots$ unabhängige Zufallsvariablen und sind die $X_{i}$ identisch verteilt und ist $N$ auf $\mathbb {N} _{0}$ definiert, so lässt sich $Y$ darstellen als

Y:=\sum _{i=1}^{N}X_{i}

.

Existieren die ersten Momente von $N,X_{1},X_{2},\dots$ , so gilt

\operatorname {E} (Y)=\operatorname {E} (N)\operatorname {E} (X_{1})

.

Diese Aussage ist auch als Formel von Wald bekannt. Sie wird z. B. in der Schadensversicherungsmathematik benutzt.

Monotone Konvergenz

Sind die nichtnegativen Zufallsvariablen $(X_{i})_{i\in \mathbb {N} }$ fast sicher punktweise monoton wachsend und konvergieren fast sicher gegen eine weitere Zufallsvariable $X$ , so gilt

\lim _{i\to \infty }\operatorname {E} (X_{i})=\operatorname {E} (X)

.

Dies ist der Satz von der monotonen Konvergenz in der wahrscheinlichkeitstheoretischen Formulierung.

Berechnung mittels der kumulantenerzeugenden Funktion

Die kumulantenerzeugende Funktion einer Zufallsvariable ist definiert als

g_{X}(t)=\ln \operatorname {E} (e^{tX})

.

Wird sie abgeleitet und an der Stelle 0 ausgewertet, so ist der Erwartungswert:

\operatorname {E} (X)=g'_{X}(0)

.

Die erste Kumulante ist also der Erwartungswert.

Berechnung mittels der charakteristischen Funktion

Die charakteristische Funktion einer Zufallsvariable $X$ ist definiert als $\varphi _{X}(t):=\operatorname {E} (e^{itX})$ . Mit ihrer Hilfe lässt sich durch Ableiten der Erwartungswert der Zufallsvariable bestimmen:

\operatorname {E} (X)={\frac {\varphi _{X}'(0)}{\mathrm {i} }}

.

Berechnung mittels der momenterzeugenden Funktion

Ähnlich wie die charakteristische Funktion ist die momenterzeugende Funktion definiert als

M_{X}(t):=\operatorname {E} \left(e^{tX}\right)

.

Auch hier lässt sich der Erwartungswert einfach bestimmen als

\operatorname {E} (X)=M_{X}'(0)

.

Dies folgt daraus, dass der Erwartungswert das erste Moment ist und die k-ten Ableitungen der momenterzeugenden Funktion an der 0 genau die k-ten Momente sind.

Berechnung mittels der wahrscheinlichkeitserzeugenden Funktion

Wenn $X$ nur natürliche Zahlen als Werte annimmt, lässt sich der Erwartungswert für $X$ auch mithilfe der wahrscheinlichkeitserzeugenden Funktion

m_{X}(t):=\operatorname {E} \left(t^{X}\right)

.

berechnen. Es gilt dann

\operatorname {E} \left[X\right]=\lim _{t\uparrow 1}m_{X}'(t)

,

falls der linksseitige Grenzwert existiert.

Beste Approximation

Ist $X$ eine Zufallsgröße auf einem Wahrscheinlichkeitsraum $(\Omega ,\Sigma ,P)$ , so beschreibt $\operatorname {E} \left(X\right)$ die beste Approximation an $X$ im Sinne der Minimierung von $\operatorname {E} \left(\left(X-a\right)^{2}\right)$ , wobei a eine reelle Konstante ist. Dies folgt aus dem Satz über die beste Approximation, da

\langle X-\operatorname {E} (X),b\rangle =0

für alle konstanten $b$ ist, wobei $\langle .,.\rangle$ das $L^{2}$ -Standardnormalskalarprodukt bezeichne. Diese Auffassung des Erwartungswertes macht die Definition der Varianz als minimaler mittlerer quadratischer Abstand sinnvoll, siehe auch Fréchet-Prinzip.

Erwartungswerte von Funktionen von Zufallsvariablen

Wenn $Y=g(X)$ wieder eine Zufallsvariable ist, so kann der Erwartungswert von $Y$ , statt mittels der Definition, auch mittels der Formel bestimmt werden:

\operatorname {E} (Y)=\operatorname {E} (g(X))=\int _{-\infty }^{\infty }g(x)f_{X}(x)\,\mathrm {d} x.

Auch in diesem Fall existiert der Erwartungswert nur, wenn

\int _{-\infty }^{\infty }\left|g(x)\right|f_{X}(x)\,\mathrm {d} x

konvergiert.

Bei einer diskreten Zufallsvariablen wird eine Summe verwendet:

\operatorname {E} (Y)=\operatorname {E} (g(X))=\sum _{i}g(x_{i})p_{X}(x_{i}).

Ist die Summe nicht endlich, dann muss die Reihe absolut konvergieren, damit der Erwartungswert existiert.

Quantenmechanischer Erwartungswert

Ist $\psi (r,t)=\langle r|\psi (t)\rangle$ die Wellenfunktion eines Teilchens in einem bestimmten Zustand $|\psi (t)\rangle$ und ist ${\hat {O}}$ ein Operator, so ist

\langle {\hat {O}}\rangle _{|\psi (t)\rangle }:=\langle \psi (t)|{\hat {O}}|\psi (t)\rangle =\int _{M^{2}}\mathrm {d} ^{n}r\,\mathrm {d} ^{n}r^{\prime }\,\psi ^{\star }(r,t)\langle r|{\hat {O}}|r^{\prime }\rangle \psi (r^{\prime },t)

der quantenmechanische Erwartungswert von ${\hat {O}}$ im Zustand $|\psi (t)\rangle$ . $M$ ist hierbei der Ortsraum, in dem sich das Teilchen bewegt, $n$ ist die Dimension von $M$ , und ein hochgestellter Stern steht für komplexe Konjugation.

Lässt sich ${\hat {O}}$ als formale Potenzreihe $O({\hat {r}},{\hat {p}})$ schreiben (und das ist oft so), so wird die Formel verwendet

\langle {\hat {O}}\rangle _{\psi }=\int _{M}\mathrm {d} ^{n}r\,\psi ^{\star }(r,t)O(r,{\frac {\hbar }{i}}\nabla _{r})\psi (r,t).

Der Index an der Erwartungswertsklammer wird nicht nur wie hier abgekürzt, sondern manchmal auch ganz weggelassen.

Beispiel

Der Erwartungswert des Aufenthaltsorts in Ortsdarstellung ist

\langle {\hat {r}}\rangle =\int _{M}\mathrm {d} ^{n}r\,\psi ^{\star }(r,t)r\psi (r,t)=\int _{M}\mathrm {d} ^{n}r\,r|\psi (r,t)|^{2}=\int _{M}\mathrm {d} ^{n}r\,rf(r,t).

Der Erwartungswert des Aufenthaltsorts in Impulsdarstellung ist

\langle {\hat {r}}\rangle =\int _{M}\mathrm {d} ^{n}p\,\Psi ^{\star }(p,t)i\hbar {\vec {\nabla }}_{p}\Psi (p,t),

wobei wir die Wahrscheinlichkeitsdichtefunktion der Quantenmechanik im Ortsraum identifiziert haben.

Erwartungswert von Matrizen und Vektoren

Sei $\mathbf {X}$ eine stochastische $m\times n$ -Matrix, mit den stochastischen Variablen $(X_{i,j})$ als Elementen, dann ist der Erwartungswert von $\mathbf {X}$ definiert als:

\operatorname {E} \left(\mathbf {X} \right)=\operatorname {E} {\begin{pmatrix}X_{1,1}&X_{1,2}&\cdots &X_{1,n}\\X_{2,1}&X_{2,2}&\cdots &X_{2,n}\\\vdots &\vdots &\ddots &\vdots \\X_{m,1}&X_{m,2}&\cdots &X_{m,n}\end{pmatrix}}={\begin{pmatrix}\operatorname {E} (X_{1,1})&\operatorname {E} (X_{1,2})&\cdots &\operatorname {E} (X_{1,n})\\\operatorname {E} (X_{2,1})&\operatorname {E} (X_{2,2})&\cdots &\operatorname {E} (X_{2,n})\\\vdots &\vdots &\ddots &\vdots \\\operatorname {E} (X_{m,1})&\operatorname {E} (X_{m,2})&\cdots &\operatorname {E} (X_{m,n})\end{pmatrix}}

.

Falls ein $n\times 1$ -Zufallsvektor $\mathbf {X}$ vorliegt gilt:

$\operatorname {E} (\mathbf {X} )=\operatorname {E} {\begin{pmatrix}X_{1}\\X_{2}\\\vdots \\X_{n}\end{pmatrix}}={\begin{pmatrix}\operatorname {E} (X_{1})\\\operatorname {E} (X_{2})\\\vdots \\\operatorname {E} (X_{n})\end{pmatrix}}={\begin{pmatrix}\mu _{1}\\\mu _{2}\\\vdots \\\mu _{n}\end{pmatrix}}={\boldsymbol {\mu }}$ .

Siehe auch

Literatur

Krishna B. Athreya, Soumendra N. Lahiri: Measure Theory and Probability Theory (= Springer Texts in Statistics). Springer Verlag, New York 2006, ISBN 0-387-32903-X (MR2247694).
Heinz Bauer: Wahrscheinlichkeitstheorie (= De Gruyter Lehrbuch). 5., durchgesehene und verbesserte Auflage. de Gruyter, Berlin, New York 2002, ISBN 3-11-017236-4 (MR1902050).
Kai Lai Chung: A Course in Probability Theory. Academic Press, Inc., San Diego (u. a.) 2001, ISBN 0-12-174151-6 (R1796326).
Walter Greiner: Quantenmechanik. 6. überarb. und erw. Auflage. Verlag Harri Deutsch, Zürich [u. a.] 2005, ISBN 3-8171-1765-5.
Erich Härtter: Wahrscheinlichkeitsrechnung für Wirtschafts- und Naturwissenschaftler. 10. Auflage. Vandenhoeck & Ruprecht, Göttingen 1974, ISBN 3-525-03114-9.
Norbert Henze: Stochastik für Einsteiger. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, doi:10.1007/978-3-658-03077-3.
Achim Klenke: Wahrscheinlichkeitstheorie. 3., überarbeitete und ergänzte Auflage. Springer Spektrum, Berlin, Heidelberg 2013, ISBN 978-3-642-36017-6, doi:10.1007/978-3-642-36018-6.
Norbert Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. Eine Einführung (= Springer-Lehrbuch). 2., überarbeitete und erweiterte Auflage. Springer-Verlag, Berlin, Heidelberg 2014, ISBN 978-3-642-45386-1.
M. Loève: Probability Theory I (= Graduate Texts in Mathematics. Band 45). 4. Auflage. Springer Verlag, Berlin, Heidelberg 1977, ISBN 3-540-90210-4 (MR0651017).
Vladimir Spokoiny, Thorsten Dickhaus: Basics of Modern Mathematical Statistics (= Springer Texts in Statistics). Springer-Verlag, Heidelberg, New York, Dordrecht, London 2015, ISBN 978-3-642-39908-4 (MR3289985).

Weblinks

Interaktive Visualisierung von Würfelbeispiel

Einzelnachweise

↑ Norbert Henze: Stochastik für Einsteiger. Vieweg+Teubner, 2008. ISBN 978-3-8348-9465-6. S. 79.
↑ https://jeff560.tripod.com/stat.html
↑ Baden-Württembergische Lehrerinnen verwenden die Schreibweise $\operatorname {E} \left(X\right)$ [1]
↑ David Meintrup und Stefan Schäffler - Stochastik: Theorie und Anwendungen. Springer-Verlag 2005.
↑ Eugen-Georg Woschni: Informationstechnik: Signal, System, Information. 1981
↑ Siehe etwa (in deutscher Übersetzung) A. N. Širjaev: Wahrscheinlichkeit 1988, S. 52 ff !
↑ Siehe Ilʹja N. Bronstein, Konstantin A. Semendjajew: Taschenbuch der Mathematik. 23. Auflage. 1987, ISBN 3-87144-492-8. Der Operator wird hier kursiv gesetzt.
↑ John Aldrich: Earliest Uses of Symbols in Probability and Statistics. online
↑ Ross, S. M.:Introduction to probability models, Academic Press, 2007, 9. Auflage, S. 143, ISBN 0-12-598062-0.
↑ H. Wirths: Der Erwartungswert - Skizzen zur Begriffsentwicklung von Klasse 8 bis 13. In: Mathematik in der Schule 1995/Heft 6, S. 330–343.

[1] Norbert Henze: Stochastik für Einsteiger. Vieweg+Teubner, 2008. ISBN 978-3-8348-9465-6. S. 79.

[2] ttps://jeff560.tripod.com/stat.html

[3] Baden-Württembergische Lehrerinnen verwenden die Schreibweise $\operatorname {E} \left(X\right)$ [1]

[4] David Meintrup und Stefan Schäffler - Stochastik: Theorie und Anwendungen. Springer-Verlag 2005.

[5] Eugen-Georg Woschni: Informationstechnik: Signal, System, Information. 1981

[6] Siehe etwa (in deutscher Übersetzung) A. N. Širjaev: Wahrscheinlichkeit 1988, S. 52 ff !

[7] Siehe Ilʹja N. Bronstein, Konstantin A. Semendjajew: Taschenbuch der Mathematik. 23. Auflage. 1987, ISBN 3-87144-492-8. Der Operator wird hier kursiv gesetzt.

[8] John Aldrich: Earliest Uses of Symbols in Probability and Statistics. online

[Ross-9] Ross, S. M.:Introduction to probability models, Academic Press, 2007, 9. Auflage, S. 143, ISBN 0-12-598062-0.

[10] H. Wirths: Der Erwartungswert - Skizzen zur Begriffsentwicklung von Klasse 8 bis 13. In: Mathematik in der Schule 1995/Heft 6, S. 330–343.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Motivation

Begriff und Notation

Begriff

Notation

Definitionen

Erwartungswert einer diskreten reellen Zufallsvariable

Erwartungswert einer reellen Zufallsvariable mit Dichtefunktion

Allgemeine Definition

Erwartungswert von zwei Zufallsvariablen mit gemeinsamer Dichtefunktion

Elementare Eigenschaften

Linearität

Monotonie

Wahrscheinlichkeiten als Erwartungswerte

Dreiecksungleichung

Beispiele

Würfeln

Sankt-Petersburg-Paradoxon

Zufallsvariable mit Dichte

Allgemeine Definition

Weitere Eigenschaften

Erwartungswert einer nicht-negativen Zufallsvariable

Sigma-Additivität

Erwartungswert des Produkts von n stochastisch unabhängigen Zufallsvariablen

Erwartungswert des Produkts von nicht stochastisch unabhängigen Zufallsvariablen

Erwartungswert einer zusammengesetzten Zufallsvariable

Monotone Konvergenz

Berechnung mittels der kumulantenerzeugenden Funktion

Berechnung mittels der charakteristischen Funktion

Berechnung mittels der momenterzeugenden Funktion

Berechnung mittels der wahrscheinlichkeitserzeugenden Funktion

Beste Approximation

Erwartungswerte von Funktionen von Zufallsvariablen

Verwandte Konzepte und Verallgemeinerungen

Lageparameter

Momente

Bedingter Erwartungswert

Quantenmechanischer Erwartungswert

Erwartungswert von Matrizen und Vektoren

Siehe auch

Literatur

Weblinks

Einzelnachweise