Die Streuungsmasse beschreiben, wie stark mit anderen $x$-Werten als z.B. dem Erwartungswert gerechnet werden muss. Bei starker Streuung, sind viele verschiedene $x$-Werte wahrscheinlich. Bei schwacher Streuung sind grössere Abweichungen vom Erwartungswert eher unwahrscheinlich.

In der obigen Abbildung sind zwei Wahrscheinlichkeitsverteilungen gezeigt, die beide den gleichen Erwartungswert $\mu$ haben. Die Verteilung $P_1(x)$ ist schlanker und höher, d.h. die Zufallsvariable $X$ hat Funktionswerte, die nicht so stark streuen. Entsprechend ist das Streuungsmass $\sigma_1$ relativ klein.

Die Verteilung rechts breitet sich mehr aus und hat deshalb ein grösseres Streuungsmass $\sigma_2$. Das andere Streuungsmass $R_2$ am Fuss der Verteilung zeigt die ganze Breite der Verteilung. Auch dieses Streuungsmass ist rechts grösser als das entsprechende $R_1$ links.

Da die Summe aller Säulen gleich der Summe aller Wahrscheinlichkeiten ist, muss sie 1 sein. Eine schlankere Wahrscheinlichkeitsverteilung hat weniger Säulen zur Verfügung und muss deshalb höhere Säulen haben, als eine breite Verteilung.

Spannweite

Die Spannweite ist das Streuungsmass, das die maximale Breite der Verteilung misst. Sie ist sehr einfach auszurechnen:

Die Spannweite $R$ ist die Breite des Spektrums an möglichen Werten $x$ der Zufallsgrösse $X$:

\[ R \;=\; x_{max} – x_{min} \]

Varianz und Standardabweichung

Die Varianz und die Standardabweichung sind die wichtigsten Streumasse, die eine Aussage über die Breite der Streuung aussagen. Sie betrachten die Streuung vom Erwartungswert aus. Die Varianz $\sigma^2$ ist definiert als die mittlere quadratische Abweichung vom Erwartungswert $\mu$. Die quadratische Abweichung vom Erwartungswert ist: 

\[ (x-\mu)^2 \]

Warum wird die quadratische Abweichung genommen? Die Abweichung kann ja positiv oder negativ sein, je nachdem, ob wir mit $x$ über oder unter dem Erwartungswert $\mu$ liegen. Um dieses Problem zu umschiffen, wird einfach das Quadrat gebildet, weil dieses immer positiv ist.

Jetzt muss der quadratische Abstand gewichtet werden. Wir tun das, indem wir ihn mit der Wahrscheinlichkeit $P(x)$ multiplizieren, d.h. die Wahrscheinlichkeit, dass diese Abweichung vorkommen wird:

\[ P(x) \cdot (x-\mu)^2 \]

Wir können auf gleiche Art auch die Streuung von gemessenen Werten anschauen. Wir gewichten den quadratischen Abstand vom Mittelwert $\overline{x}$ mit der relativen Häufigkeit $h(x)$: 

\[ h(x) \cdot (x-\overline{x})^2 \]

Für die Noten von Alice mit dem Mittelwert $\overline{x}=4.71$ ist der Abstand von $x=3.5$, mutlipliziert mit der relativen Häufigkeit $h(3.5)$:

\[ \frac{2}{7} \cdot (3.5 – 4.71)^2 = 0.421 \]

Die folgende Tabelle zeigt alle berechneten Werte für Alice:

$x$$h(X=x)$$(x-\overline{x})^2$$h(x) \cdot (x-\overline{x})^2$
3.5$\frac{2}{7}$1.4740.421
4$\frac{1}{7}$0.5100.073
4.5$\frac{1}{7}$0.0460.007
5$0$0.0820.000
5.5$\frac{1}{7}$0.6170.088
6$\frac{2}{7}$1.6530.472
Total11.0611.061

Am Schluss addieren wir alle gewichteten quadratischen Abweichungen vom Mittelwert und erhalten so die mittlere quadratische Abweichung vom Mittelwert, die Varianz $\sigma^2$ für unsere Stichprobe. Für Alice beträgt sie:

\[ (\sigma_A)^2 = 1.061 \]

Die Quadratwurzel von der Varianz heisst Standardabweichung $\sigma_A$:

\[ \sigma_A = 1.030 \]

Wie ist die Varianz für die Stichprobe von Bobs Noten? Wir stellen wieder die Tabelle auf und summieren die gewichteten quadratischen Abweichungen vom Mittelwert:

$x$$h(X=x)$$(x-\overline{x})^2$$h(x) \cdot (x-\overline{x})^2$
3.5$0$2.2500.000
4$0$1.0000.000
4.5$\frac{2}{7}$0.2500.071
5$\frac{3}{7}$0.0000.000
5.5$\frac{2}{7}$0.2500.071
6$0$1.0000.000
Total10.143

Die Varianz und die Standardabweichung betragen für Bob:

\[ (\sigma_B)^2 = 0.143 \quad \quad \sigma_B = 0.378 \]

Die Notenverteilung von Bob streut viel weniger als diejenige von Alice. Graphisch sehen wir das sofort, denn Bobs Noten weichen höchstens um eine halbe Note vom Mittelwert 5 ab, während Alice fast nur stark abweichende Noten hat.

Die Varianz $\sigma^2$ ist die mittlere quadratische Abweichung vom Erwartungswert $\mu$ einer Population oder vom Mittelwert $\overline{x}$ einer Stichprobe:

\[ \sigma^2 = \sum_i \Big( P(x_i) \cdot (x_i-\mu)^2 \Big) \]

\[ \sigma^2 = \sum_i \Big( h(x_i) \cdot (x_i-\overline{x})^2 \Big) \]

Die Standardabweichung $\sigma$ ist Quadratwurzel der Varianz.

Beispiel

Berechne den Mittelwert $\overline{x}$ und die Standardabweichung $\sigma$ für die statistisch erhobene Körpergrösse (in cm) von 6 Schülern einer Klasse und zeichne die Verteilung mit den beiden Massen.

\[ \Omega = \Big\{ 159, 166, 168, 172, 172, 185 \Big\} \]


Die relative Häufigkeit ist in diesem Fall für jeden Schüler gleich. Wenn wir 6 Schüler haben, ist für die relative Häufigkeit jeweils $h(x) = \frac{1}{6}$ einzusetzen. Jetzt multiplizieren wir jede Körpergrösse mit dieser relativen Häufigkeit und bilden schliesslich die Summe. Wir erhalten auf diese Weise den Mittelwert

\[ \overline{x} = \underline{170.33\;\text{cm}} \]

Jetzt können wir den quadratischen Abstand vom Mittelwert berechnen (Spalte 4) und sie mit der relativen Häufigkeit multiplizieren (Spalte 5). Die Summe der gewichteten quadratischen Abweichungen entspricht der mittleren quadratischen Abweichung, d.h. der Varianz:

\[ \sigma^2 = \underline{62.222\;\text{cm}^2} \]

Wir ziehen die Wurzel davon und wir erhalten die Standardabweichung:

\[ \sigma = \underline{7.89\;\text{cm}} \]

$x$ $h(x)$ $x \cdot h(x)$$(x-\overline{x})^2$$h(x) \cdot (x-\overline{x})^2$
159$\frac{1}{6}$26.500128.44421.407
166$\frac{1}{6}$27.66718.7783.130
168$\frac{1}{6}$28.0005.4440.907
172$\frac{1}{6}$28.6672.7780.463
172$\frac{1}{6}$28.6672.7780.463
185$\frac{1}{6}$30.833215.11135.852
Total1170.33362.222

Aufgabensammlung

  • Statistik und Binomialverteilung (5057) – Aufg. 2

    2 Teilaufgaben (pdf/Video-Lösung):
    Lagemasse und Streuungsmasse bestimmen