Mit den Lage- und Streuungsmassen werden Wahrscheinlichkeitsverteilungen beurteilt und beschrieben. Wahrscheinlichkeitsverteilungen haben meistens eine Wert $x$ der Zufallsgrösse, der besonders wahrscheinlich ist. Die Frage darüber, wo sich dieser Wert auf der $x$-Achse befindet, beantworten die Lagemasse.

Modus (Modalwert)

Wir schauen uns ein erstes Beispiel an. Es ist ein Histogramm mit der Notenverteilung zweier Schüler. Alice (grün) hat klar ihre Stärken und Schwächen. Sie hat sowohl schwächere Noten (3.5 in zwei Fächern), dafür aber sehr gute Noten (zwei 6er). Bob (blau) ist nirgends brillant, aber dafür eigentlich überall gut. Seine Noten bewegen sich alle um die 5 herum.

Die zwei einfachsten Lagemasse sind das Maximum und das Minimum. Für welchen $x$-Wert gibt es die grösste bzw. kleinste Auftretenswahrscheinlichkeit? Im Fall von Bob liegt das Maximum klar bei der 5. Die Notenverteilung von Alice hat zwei Maxima, eines bei 3.5 und eines bei der 6.

Das Maximum wird meistens Modus oder Modalwert $D$ genannt. Es ist der Wert der Verteilung mit der grössten Wahrscheinlichkeit. Bei diesem $x$-Wert ist die Auftretenswahrscheinlichkeit maximal. 

\[ P(X=D) = P_{\text{max}} \]

Es ist aber nicht immer möglich oder sinnvoll das Maximum oder Minimum einer Verteilung anzugeben.

Mittelwert

Der Mittelwert wird oft auch verkürzt Mittel genannt oder auch Durchschnitt. Wir berechnen den Mittelwert für Alice und für Bob und erhalten:

\[ \text{Alice:} \quad \overline{x}_A = \frac{2 \cdot 3.5 + 4 + 4.5 + 5.5 + 2 \cdot 6}{7} = \frac{33}{7} = 4.71 \]

\[ \text{Bob:} \quad \overline{x}_B = \frac{2 \cdot 4.5 + 3 \cdot 5 + 2 \cdot 5.5}{7} = \frac{35}{7} = 5.00 \]

Bob hat den höheren Mittelwert. Dass sein Mittelwert eine runde Zahl gibt ist nicht weiter erstaunlich. Er hat 3 Fünfer und dann hat er gleich viele 4.5, wie er 5.5 hat, d.h. es gibt bei ihm gleich viele Noten, die den Schnitt etwas senken, wie es Noten gibt, die den Schnitt anheben. Wegen dieser Symmetrie ist der Mittelwert genau bei 5.00.

Der Mittelwert ist eine klare Lagegrösse, denn er sagt, mit welchem $x$-Wert alle Noten ersetzt werden könnten, was jedoch immer noch die gleiche Notensumme ergeben würde. Bei Bob ist der Fall klar. Bei Alice liegt der Mittelwert wie ein Schwerpunkt zwischen ihren beiden Extremen.

Der (arithmetische) Mittelwert $\overline{x}$ (Durchschnitt) wird berechnet, indem die vorkommenden Ergebnisse $x$ in der Stichprobe summiert und durch die Grösse der Stichprobe $n$ (Anzahl addierter Ergebnisse) geteilt wird:

\[ \overline{x} \; = \; \frac{\;\; \sum_{i=1}^{n} x_i \;\;}{n} \]

Neben dem arithmetischen Mittelwert, gibt es auch den geometrischen Mittelwert. Bei ihm wird nicht addiert, sondern multipliziert und dann mit der entsprechenden Wurzel der Wert wieder korrigiert. Für Alice erhalten wir:

\[ \overline{x}_{A,\text{geom.}} = \Big( 3.5^2 \cdot 4 \cdot 4.5 \cdot 5.5 \cdot 6^2 \Big)^{\frac{1}{7}} = 4.60 \]

Schliesslich gibt es noch den sog. harmonischen Mittelwert, der uns an den Ersatzwiderstand einer Parallelschaltung von elektrischen Widerständen erinnert:

\[ \overline{x}_{A,\text{harm.}} = \frac{7}{\frac{2}{3.5} + \frac{1}{4} + \frac{1}{4.5} + \frac{1}{5.5} + \frac{2}{6}} = 4.49 \]

Erwartungswert

Der Erwartungswert $\mu$ wird oft mit dem Mittelwert $\overline{x}$ verwechselt, weil beide gleich berechnet werden. Der Unterschied liegt in der Anwendung. Bei gemessenen Werten aus einer Stichprobe (wie die Noten in unserem Beispiel), spricht man von Mittelwert. Wenn die Werte noch nicht vorliegen, es um eine Abschätzung eines zukünftigen Vorgangs geht oder wir den Mittelwert einer ganzen Population angeben möchten, ohne dass wir sie effektiv gemessen haben, spricht man vom Erwartungswert.

Der Unterschied zwischen dem Mittelwert und dem Erwartungwert ist ähnlich zum Unterschied zwischen der relativen Häufigkeit und der Wahrscheinlichkeit. Die relative Häufigkeit wird ermittelt aus effektiven Messungen. Genauso wird der Mittelwert aus effektiven Ergebnissen ermittelt. Die Wahrscheinlichkeit ist die theoretische, berechnete Idealgrösse; eine Vorhersage, an welchen Wert sich die relative Häufigkeit im Zufallsexperiment annähern wird.

Der Erwartungswert $\mu$ ist der erwartete Mittelwert in der ganzen Population, d.h. für sämtliche Ergebnisse, aufgrund einer Berechnung mit der Wahrscheinlichkeit.

Wenn wir die Berechnung des Mittelwerts etwas anders hinschreiben, erkennen wir die Art und Weise, wie der Erwartungswert berechnet wird. Wir schauen uns das am Beispiel von Alice an. Wir könnten den Mittelwert $\overline{x}_A$ auch folgendermassen berechnen:

\[ \overline{x}_A = \frac{2}{7} \cdot 3.5 + \frac{1}{7} \cdot 4 + \frac{1}{7} \cdot 4.5 + \frac{1}{7} \cdot 5.5 + \frac{2}{7} \cdot 6 \]

Jede Note wird mit ihrer relativen Häufigkeit gewichtet. Da wir sieben Noten haben, ist die relative Häufigkeit jeweils $\frac{1}{7}$. Der Mittelwert ist hier die Summe der mit der relativen Häufigkeit gewichteten Noten.

Nun benutzen wir die gleiche Idee auf den zukünftigen, theoretischen Fall. Für eine gegebene Wahrscheinlichkeitsverteilung können wir alle Ergebnisse $x_i$ mit ihrer jeweiligen Wahrscheinlichkeit $P(x_i)$ gewichten und erhalten dann den Erwartungswert $\mu$.

Der Erwartungwert $\mu$ ist die Summe sämtlicher vorkommender $x_i$-Ergebnisse, die mit ihrer Wahrscheinlichkeit $P(x_i)$ gewichtet worden sind:

\[ \mu = \sum_i \Big( P(x_i) \cdot x_i \Big) \]

Beispiel

Berechne die Erwartungswerte $\mu_1$ für die Augenzahl eines Würfels, wie auch $\mu_2$ für die Augensumme zweier Würfel.


Für den einzelnen Würfel schreiben wir:

\[ \mu_1 = \sum_{i=1}^6 \Big( \frac{1}{6} \cdot i \Big) = \frac{1}{6} \cdot \sum_{i=1}^6 i \]

Mit dem Trick von Gauss können wir die Summe umschreiben:

\[ \mu_1 = \frac{1}{6} \cdot \frac{6}{2} \cdot (6+1) = \underline{3.5} \]

Dieser Erwartungswert kann gar nicht gewürfelt werden, weil er keine natürlich Zahl ist. Er sagt uns aber, dass der erwartete Mitelwert 3.5 betragen wird. Wie sollen wir das verstehen? Wenn wir 1000 Leute mit einem Würfel ausstatten und sie auffordern zu würfeln, dann wird der Mittelwert ihrer Ergebnisse (etwa) 3.5 sein oder wir würfeln 1000 mal und schauen, welche Augenzahl wir im Durchschnitt erhalten haben: 3.5.

Für die zwei Würfel brauchen wir zuerst noch einen Ausdruck für die Wahrscheinlichkeitsverteilung für die Augensumme $x$. Hier ist sie nochmals:

{{ imgs:zufallsgroesse_02.png?nolink&500 |}}

Wir haben sie noch als Formel notiert. Hier mein Ansatz:

\[ P(x) = \frac{6-|7-x|}{36} \]

Überprüfen wir den Ansatz, indem wir einige Werte mit der Grafik vergleichen:

\[ P(2) = \frac{6-|7-2|}{36} = \frac{6-5}{36} = \frac{1}{36} \]

\[ P(7) = \frac{6-|7-7|}{36} = \frac{6}{36} \]

\[ P(2) = \frac{6-|7-12|}{36} = \frac{6-5}{36} = \frac{1}{36} \]

Das stimmt! Jetzt können wir den Erwartungswert für zwei Würfel aufstellen. Beachte, dass alle möglichen Ergebnisse $x_i$ von 2 bis 12 gehen:

\[ \mu_2 = \sum_{i=2}^{12} \Big( \frac{6-|7-i|}{36} \cdot i \Big) \]

Das wäre eine etwas aufwendigere Rechenarbeit. Es geht einfacher! Da die Wahrscheinlichkeitsverteilung links und rechts des Maximums bei 7 spiegelsymmetrisch ist, gibt es gleich viele Zahlen, die den Schnitt anheben, wie solche, die den Schnitt senken. In Summe ist der Mittel- bzw. Erwartungswert einfach bei 7.

\[ \mu_2 = \underline{\;7\;} \]

Die Tatsache, dass beide Würfel unabhängig von einander sind, sagt auch, dass wir einen Erwartungswert von $3.5$ für einen Würfel und $3.5$ für den anderen Würfel haben. Für ihre Augensumme erwarten wir deshalb $3.5 + 3.5 = 7$.

Medianwert

Als Median (manchmal auch Zentralwert) verstehen wir den Wert, der in der Tabelle in der Mitte steht. Bei einer ungeraden Anzahl Tabellenwerte ist das ein bestimmter Wert. Bei einer geraden Anzahl Werte, wird der Mittelwert des oberen und unteren Medianwerts genommen.

Sehr oft ist der Median etwa gleich gross wie der Mittelwert, jedoch nicht immer. Ein extremes Beispiel wäre die folgende Liste von Messwerten, die der Grösse nach geordnet worden sind:

\[ 1,\; 1,\; 1,\; \color{#418AB3} 2,\; \color{#418AB3} 2,\; 3,\; 90,\; 100 \]

Der Mittelwert beträgt $\overline{x}=25$. Der Median ist aber $\color{#418AB3} {\tilde{x}=2}\;$! Wir müssen den Median aber anders anschauen als einen Mittelwert. Er sagt lediglich aus, dass es gleich viele Messwerte gibt, die unterhalb des Medians liegen, wie oberhalb. Das ist in unserer extremen Liste der Fall: Es gibt gleich viele Messungen unterhalb des Werts $\color{#418AB3} 2$, wie es Messungen über dem Wert $\color{#418AB3} 2$ gibt. Das hat schon eine gewisse Aussage.

Der Median $\tilde{x}$ ist der mittlere Wert in der geordneten Liste von Messwerten $x_i$. Es gibt gleich viele Messwerte, die über, wie solche, die unter dem Median liegen. Bei einer geraden Anzahl von Messwerten wird der Mittelwert des oberen und unteren Medianwerts genommen.

Der Median kann, muss aber nicht gleich dem Mittelwert sein. Bei spiegelsymmetrischen Verteilungen stimmen Median und Mittelwert überein.

Aufgabensammlung

  • Statistik und Binomialverteilung (5057) – Aufg. 2

    2 Teilaufgaben (pdf/Video-Lösung):
    Lagemasse und Streuungsmasse bestimmen