Beschreibung

Das Thema dieser Animation ist die Zuverlässigkeit der aus einer Stichprobe gewonnenen statistischen Kenngrössen Mittelwert und Varianz. Ihr Zweck ist es, einige Grundaussagen dieses Problems zu illustrieren.
Es wird dabei vorausgesetzt, dass Sie die Begriffe Mittelwert und Standardabweichung bereits kennen und wissen, was sie über eine Datenliste aussagen. Die Varianz ist das Quadrat der Standardabweichung.
Gegeben ist eine Grundgesamtheit (charakterisiert durch eine Menge von möglichen Ergebnissen, die mit gewissen Wahrscheinlichkeiten auftreten), über die man Aussagen machen möchte. Nun sei (wie es in der Praxis oft der Fall ist) diese Grundgesamtheit einer direkten statistischen Auswertung nicht zugänglich (z.B. weil die Ergebnismenge zu groß ist). In diesen Fällen muss man sich mit einer Stichprobe behelfen. In der Animation ist die Grundgesamtheit durch folgende Liste der möglichen Ergebnisse und der zugehörigen Wahrscheinlichkeiten charakterisiert:

 Das Ergebnis   tritt auf mit Wahrscheinlichkeit 
0.6 0.04
0.7 0.04
0.8 0.08
0.9 0.16
1.0 0.20
1.1 0.24
1.2 0.16
1.3 0.04
1.4 0.04

Die wichtigsten statistischen Kennzahlen dieser Grundgesamtheit sind (gerundet):
  • Mittelwert: m  = 1.024
  • Standardabweichung: s  = 0.1817
  • Varianz (Quadrat der Standardabweichung): s 2 = 0.033
Aus der Grundgesamtheit wird eine Stichprobe von 10 (gemäß den obigen Wahrscheinlichkeiten unabhängig voneinander gewonnenen) Ergebnissen gezogen und deren Mittelwert m und Varianz s 2 berechnet. Frage: Mit welcher Sicherheit lässt sich daraus auf die entsprechenden Kennzahlen der Grundgesamtheit schließen?

Um diese Frage zu beantworten, stellen wir uns (im Gedankenexperiment) vor, dass mehrere Stichproben gezogen werden:
  • Schritte 1 - 6:
    In der Animation werden drei Stichproben gezeigt. Sie fallen alle ein bisschen verschieden aus: Die aus ihnen gewonnenen Kennzahlen Mittelwert (m) und Varianz (s 2) weichen in den drei Fällen voneinander ab, sind daher mit statistischen Unsicherheiten behaftet. Ein Maß für diese Unsicherheit erhalten wir, indem wir untersuchen, wie sich Stichproben voneinander unterscheiden. Das wollen wir in den folgenden Schritten tun.
    (Mit Hilfe der rechts von den Daten stehenden Dreiecke können Sie die Stichproben und die Häufigkeitstabellen auch während der späteren Schritte betrachten).
     
  • Schritt 7:
    Aus den drei Stichproben-Mittelwerten wird der Mittelwert berechnet. Um zu erfahren, wie sich diese Größe für eine große Zahl von Stichproben verhält, führen Sie die Maus über den roten Schriftzug "Liesmich"!
    Anmerkung: Das in diesem Text verwendete Symbol E(...) bezeichnet das Mittel über eine große Zahl von Stichproben (d.h. den Erwartungswert).
     
  • Schritt 8:
    Aus den drei Stichproben-Mittelwerten wird die Varianz berechnet. Um zu erfahren, wie sich diese Größe für eine große Zahl von Stichproben verhält, führen Sie die Maus über den blauen Schriftzug "Liesmich"!
    Anmerkung: Die Standardabweichung (Streuung) Dm der Stichproben-Mittelwerte über eine große Zahl von Stichproben ist durch die Formel Dm2  =  E( (m - E(m))2 ) oder, damit gleichbedeutend, durch Dm2  =  E(m2) - E(m)2 definiert.
     
  • Schritt 9:
    Aus den drei Stichproben-Varianzen wird der Mittelwert berechnet. Um zu erfahren, wie sich diese Größe für eine große Zahl von Stichproben verhält, führen Sie die Maus über den grünen Schriftzug "Liesmich"!
Die Animation beinhaltet keine Herleitung der in den Liesmich-Texten dargestellten Formeln, soll aber deren Bedeutung illustrieren.

Mit Hilfe des Buttons "Reset" können Sie jederzeit zum Beginn der Animation zurückkehren. Die drei gezeigten Stichproben sind fix vorgegeben, werden bei erneutem Ansehen also wiederholt.



Was sich daraus lernen lässt:

Versuchen Sie, sich mit Hilfe der Animation (und den drei in den Liesmich-Texten gezeigten Formeln, die Sie am besten aufschreiben) folgenden Sachverhalt klar zu machen:

Obwohl die Werte der statistischen Kennzahlen m und s einer Stichprobe im Voraus nicht festehen, lassen sich (sofern die Grundgesamtheit bekannt ist) "Erwartungen" für sie angeben. Dies wird dazu benutzt, um den in der Praxis wichtigeren Fall zu betrachen, dass die Grundgesamtheit unbekannt ist. Nachdem eine Stichprobe gezogen wurde, lassen sich aus der Kenntnis von m und s folgende Schäzungen gewinnen:
  • Der beste Schätzwert für den (unbekannten) Mittelwert m der Grundgesamtheit ist der Mittelwert m der Stichprobe.
     
  • Die statistische Unsicherheit (Streuung) Dm dieses Schätzwerts lässt sich ebenfalls angeben: Sie ergibt sich aus der Standardabweichung s und dem Umfang n der Stichprobe zu

    Dm  =  n-1/2 s .

    Diese Formel wird manchmal als "Wurzel-aus-n-Regel" bezeichnet. Mit ihr ist der einleuchtende Satz "Je größer die Stichprobe, umso genauer die Aussagen über die Grundgesamtheit, die aus ihr gewonnen werden können" präziser gefasst: Um die Unsicherheit in der Schätzung des Mittelwerts der Grundgesamtheit zu halbieren, muss der Umfang der Stichprobe vervierfacht werden! Beachten Sie aber, dass die auf der rechten Seite stehende Größe s unbekannt ist.
     
  • Der beste Schätzwert für die Standardabweichung s der Grundgesamtheit ist die so genannte "empirische Streuung" (auch "mittlerer Fehler einer Einzelmessung")

    (n/(n - 1))1/2 s .

    Für große n ist sie ungefähr gleich der Standardabweichung.
     
  • Die beiden vorangegangenen Resultate lassen sich zur Schätzung der statistischen Unsicherheit

    Dm  »  (n - 1)-1/2 s

    kombinieren. Die Kennzahl auf der rechten Seite wird auch als "mittlerer Fehler des Mittelwerts" bezeichnet. Sie erlaubt es, allein aus den Daten der Stichprobe die Zuverlässigkeit des Schlusses auf die Grundgesamtheit anzugeben. Für große n erhalten wir die einfache Formel

    Dm  »  n-1/2 s .

  • Alle diese Formeln gelten genau genommen nur dann, wenn die Ergebnisse einer Stichprobe unabhängig voneinander, d.h. "mit Zurücklegen" gezogen werden. Die Stichprobe kann dann einen beliebigen Umfang erreichen, d.h. n kann beliebig groß werden. In der Praxis werden Stichproben aber oft "ohne Zurücklegen" aus einer gegebenen Grundmenge gewonnen (z.B. bei Meinungsumfragen, wenn jede Person höchstens einmal befragt wird). Ist die Wahrscheinlichkeit, ein Element der Grundmenge öfter zu ziehen, vernachlässigbar klein, so können die obigen Formeln auch für diesen Fall verwendet werden. (Ist dies nicht der Fall, so ist die Zuverlässigkeit der aus einer Stichprobe gewonnenen Schätzungen sogar nicht größer! Im Grenzfall umfasst die Stichprobe die gesamte Grundmenge, wodurch alle statistischen Unsicherheiten verschwinden).
Ein konkretes Beispiel hierzu wird in Aufgabe 5 behandelt.