Wir können auf dem Computer das Würfeln sehr einfach simulieren und ihn eine Tabelle erstellen lassen. In dieser Tabelle zählen wir einfach die Anzahl, wie oft ein Ereignis \(E_i\) eingetreten ist. Als Ereignisse nehmen wir die sog. Elementarereignisse, die jeweils nur ein Ergebnis beinhalten:
\[ E_1=\big\{1\big\}, \; E_2=\big\{2\big\}, \; … \quad \rightarrow \quad E_i=\big\{i\big\} \]
Die Anzahl wird als absolute Häufigkeit \(H_n(E_1)\) der gezählten Ereignisse \(E_1\) nach \(n\) Versuchen genannt. Es ist eine etwas umständliche Formulierung für das einfache Zählen der Einsen, Zweier, Dreier etc.
Die absolute Häufigkeit \(H_n(E)\) ist die Zahl, wie oft das Ereignis \(E\) gezählt wurde nach \(n\) Versuchen.
Konkret haben wir nach \(n=20\) Würfen folgende absolute Häufigkeiten:
\[ H_{20}\big(\{1\}\big) = 4, \;\;\; H_{20}\big(\{2\}\big) = 2, \;\;\; H_{20}\big(\{3\}\big) = 5 \]
\[ H_{20}\big(\{4\}\big) = 6, \;\;\; H_{20}\big(\{5\}\big) = 1, \;\;\; H_{20}\big(\{6\}\big) = 2 \]
Zusammen bilden sie die Anzahl Versuche, nämlich 20. Die 4 ist bisher am häufigsten vorgekommen, nämlich 6 mal und damit 6 mal häufiger als die 5! Die Unterschiede zwischen den einzelnen Augenzahlen ist sehr gross.
Nach \(n=100\) Würfen haben wir folgenden Zwischenstand:
\[ H_{100}\big(\{1\}\big) = 20, \;\;\; H_{100}\big(\{2\}\big) = 15, \;\;\; H_{100}\big(\{3\}\big) = 20 \]
\[ H_{100}\big(\{4\}\big) = 20, \;\;\; H_{100}\big(\{5\}\big) = 12, \;\;\; H_{100}\big(\{6\}\big) = 13 \]
Die Zahlen sind alle rund fünf mal grösser und betragen in Summe 100. Die 1, 3 und 4 sind am häufigsten vorgekommen und zwar je 20 mal. Die 5 bildet immer noch das Schlusslicht mit nur 12 auf dem Zähler. Wenn wir die absolute Häufigkeit für jede Augenzahl plotten, erhalten wir den nachfolgenden Verlauf.
Dieser Verlauf ist nicht besonders hilfreich. Die absoluten Häufigkeiten nehmen natürlich zu, aber nicht alle genau gleich schnell. Wir haben, selbst nach einer scheinbar grossen Zahl an Versuchen (\(n\)=100), absolute Häufigkeiten \(H_{100}\), die von 12 bis 20 reichen.
Interessanter wird es, wenn wir die absolute Häufigkeit durch die Anzahl Versuche bis dahin teilen. Wir erhalten damit die sog. relative Häufigkeit \(h_n(E)\) des Ereignisses \(E\) nach \(n\) Versuchen:
Die relative Häufigkeit \(h_n(E)\) ist die Zahl, wie oft das Ereignis \(E\) gezählt wurde nach \(n\) Versuchen im Vergleich zur Gesamtzahl der Versuche \(n\). Es ist damit die absolute Häufigkeit \(H_n(E)\) in Relation zu der Anzahl Versuche \(n\):
\[ h_n(E) = \frac{H_n(E)}{n} \]
Für die relativen Häufigkeiten \(h_{20}\) nach 20 Versuchen, dividieren wir die absoluten Häufigkeiten \(H_{20}\) mit 20 und erhalten:
\[ h_{20}\big(\{1\}\big) = 0.20, \;\;\; h_{20}\big(\{2\}\big) = 0.10, \;\;\; h_{20}\big(\{3\}\big) = 0.25 \]
\[ h_{20}\big(\{4\}\big) = 0.30, \;\;\; h_{20}\big(\{5\}\big) = 0.05, \;\;\; h_{20}\big(\{6\}\big) = 0.10 \]
Für unsere Erhebung nach 100 Versuchen erhalten wir:
\[ h_{100}\big(\{1\}\big) = 0.20, \;\;\; h_{100}\big(\{2\}\big) = 0.15, \;\;\; h_{100}\big(\{3\}\big) = 0.20 \]
\[ h_{100}\big(\{4\}\big) = 0.20, \;\;\; h_{100}\big(\{5\}\big) = 0.12, \;\;\; h_{100}\big(\{6\}\big) = 0.13 \]
Der Vorteil der relativen Häufigkeiten ist offensichtlich: Wir können sie erstmals miteinander vergleichen. Die 1 kommt im Schnitt nach 100 Versuchen immer noch gleich häufig vor, wie nach 20 Versuchen. Die 2 hat aufgeholt und ist von 0.10 auf 0.15 angestiegen. Umgekehrt hat die relative Häufigkeit für die 3 von 0.25 auf 0.20 abgenommen. Stark aufgeholt hat auch das Schlusslicht 5, von 0.05 auf 0.12. Wir vermuten eine allgemeine Stabilisierung und Angleichung der Werte. Ein klarerer Bild erhalten wir, wenn wir die relative Häufigkeit \(h_n\) plotten.
Jetzt erkennen wir, dass mit der Anzahl Versuche die relativen Häufigkeiten anfangs noch stark schwanken, sich dann aber immer mehr beruhigen und in die Nähe des theoretischen Erwartungswerts von \(\frac{1}{6} \approx \(1.67 bewegen. Mit einer grossen Anzahl Wiederholung, reduzieren wir tendenziell die Schwankungen und kommen der Theorie immer näher, die besagt, dass alle Seiten des Würfels die gleiche Wahrscheinlichkeit haben, aufzutreten.
Interessant ist, dass sich die Verläufe nicht streng annähern. Wir erkennen das z.B. am Verlauf der relativen Häufigkeit für das Ereignis \(E_5\), d.h. eine 5 zu würfeln. Ab etwa 200 Versuchen kommt die 5 aus unerklärlichen Gründen unterdurchschnittlich oft vor, so dass sich ihre Kurve vom theoretischen Wert wieder etwas entfernt. Da können wir nichts tun. Wir wissen nur, dass solche Ausbrüche mit einer noch grösseren Anzahl Wiederholungen \(n\) immer seltener und vor allem weniger ausgeprägt werden.
Das Gesetz der grossen Zahlen besagt, dass sich die relative Häufigkeit \(h_n(E)\) eines Ergebnisses \(E\) stabilisiert, wenn das Zufallsexperiment sehr oft (\(n\) gross) und natürlich unter gleichen Bedingungen wiederholt wird.
Die relative Häufigkeit nähert sich dem theoretischen Wert der Wahrscheinlichkeit des Ergebnisses \(P(E)\) mit zunehmender Anzahl Versuche an. Die Annäherung ist nicht-monoton, d.h. die relative Häufigkeit kann sich kurzzeitig auch wieder vom theoretischen Wert entfernen. Für grosse Zahlen \(n \rightarrow \infty\) entspricht der Grenzwert der relativen Häufigkeit der Wahrscheinlichkeit:
\[ P(E) = \lim_{n\rightarrow\infty}\Big(h_n(E)\Big) \]
publiziert:
überarbeitet:
publiziert:
überarbeitet:
Schreib deine Frage / Kommentar hier unten rein. Ich werde sie beantworten.
Schreibe einen Kommentar
Du musst angemeldet sein, um einen Kommentar abzugeben.