0,05 - in signifikanter Mission

Lernpfad erstellt und betreut von:

die_normalverteilten

E-mail: reinhard.raml@univie.ac.at
Homepage: http://www.univie.ac.at/soziologie-statistik/
Steckbrief
Kurs-Informationen
Ansicht mit Navigations-Frame
Lernpfadseite als User öffnen (Login)
Lernpfadseite bearbeiten (Autor)

Übersicht:       
Hilfe
1. Stichprobe und Grundgesamtheit
2. Testen von Hypothesen
3. Literatur

Testen von Hypothesen
 
2.1 Formulieren von Hypothesen
Hypothesen dienen in der Wissenschaft der Überprüfung von Theorien. In Kapitel 1 haben wir von Eigenschaften in einer Stichprobe auf Eigenschaften in der Grundgesamtheit geschlossen.
Hier wählen wir einen etwas anderen Zugang: Zunächst stellen wir bestimmte Behauptungen über Sachverhalte in der Population auf, um sie danach anhand einer Stichprobe zu überprüfen. Diese Behauptungen nennen wir Hypothesen, die wir aus einer Theorie ableiten und an der Empirie (erhobene Daten) überprüfen.

Alternativhypothesen (H1)

Alternativhypothesen sind Teilaussagen einer Theorie und gehen über den gegenwärtigen Erkenntnisstand hinaus. Man betritt sozusagen neues Terrain, postuliert neue Sachverhalte und konfrontiert diese hernach mit der empirischen Erfahrungswelt. Im Großen und Ganzen unterscheidet man zwischen Unterschiedshypothesen und (Vergleiche von Häufigkeiten und Mittelwerten) und Zusammenhangshypothesen (Korrelationen, lineare Regression etc.). Eine weitere Dimension in der Differenzierung von Hypothesen besteht in der Gerichtetheit vs. Ungerichtetheit einer Hypothese.
Gerichtete Hypothesen behaupten, eine Gruppe/Produkt/Objekt etc. sei bezüglich einer Eigenschaft besser oder schlechter als eine vergleichbare Einheit, ungerichtete Hypothesen postulieren lediglich, dass ein Unterschied besteht (Unterschiedshypothesen).
Gerichtete Zusammenhangshypothesen beschreiben positive oder negative Zusammenhänge (vgl. Korrelation, lineare Regression), während ungerichtete Zusammenhangshypothesen lediglich behaupten, dass ein Zusammenhang besteht, in welche Richtung auch immer.
Hypothesen müssen schließlich in statistische Hypothesen übergeführt werden, um sie entsprechenden statistischen Tests zu unterziehen. Diese beinhalten meist mathematische Beziehungen und müssen den Inhalt der ursprünglichen Hypothese so gut wie möglich wiedergeben.

Nullhypothesen (H0)

Die Nullhypothese ist im Grund genommen bezüglich der Alternativhypothese redundant, d.h. sie besitzt keinerlei zusätzliche, neue Information. Sie ist lediglich die Negativhypothese zur Alternativhypothese, und negiert das in ihr formulierte Postulat. Allerdings stellt sie in den klassischen Verfahren zur Überprüfung der Signifikanz die Basis dar, aufgrund deren entschieden wird, ob die Alternativhypothese beibehalten wird oder nicht.


Lernstoff
 
2.2 Kriterien einer wissenschaftlichen Hypothese
Eine wissenschaftliche Hypothese...


(1) ... bezieht sich auf einen realen Sachverhalt, der empirisch untersuchbar ist.

(2) ... ist eine allgemeingültige Aussage (All-Satz).

(3) ... hat zumindest implizit die Struktur eines Konditional-Satzes (Wenn-dann-Satz, Je-desto-Satz).

(4) ... ist grundsätzlich falsifizierbar, d.h. es müssen Ereignisse denkbar sein, die sie wiederlegen.


Aufgabe:

Bearbeiten Sie nun Punkt 3 des Aufgabenblatts



Eintrag in das Lerntagebuch
 
2.3 Fehlerarten
In der klassischen Prüfstatistik können uns grundsätzlich zwei Arten von Fehlern passieren: Entweder wir akzeptieren eine Alternativhypothese, obwohl in der Grundgesamtheit tatsächlich die Nullhypothese gilt (Fehler erster Art bzw. ALPHA-Fehler, Irrtumswahrscheinlichkeit) oder wir behalten die Nullhypothese bei, obwohl in der Population tatsächlich die Alternativhypothese gilt (Fehler zweiter Art bzw. BETA-Fehler).



Mit den jeweiligen Fehlertypen sind in der sozialwissenschaftlichen Forschung unterschiedliche Konsequenzen verbunden. Je nach Art dieser Folgen, muss man von Fall zu Fall entscheiden, welche der beiden Fehlerquellen man reduzieren möchte.


Aufgabe:

Bearbeiten Sie nun Punkt 4 des Aufgabenblattes (siehe link unter Kap. 1.2)!



Eintrag in das Lerntagebuch
 
2.4 Das Konzept der Signifikanz
https://www.mathe-online.at/materialien/die_normalverteilten/files/m1_bortz4.pdf


Grundlegende Idee

Die grundlegende Idee bei der Überprüfung der Signifikanz eines Stichprobenergebnisses, eine Hypothese als richtig voraus zu setzen und zu überprüfen, ob das gewonnene Ergebnis ein Beleg für die Richtigkeit der Annahme ist oder ob es eher dagegen spricht. In der klassischen Prüfstatistik gehen wir von der Gültigkeit der Nullhypothese aus. Danach berechnen wir einen Kennwert für die Verträglichkeit der Stichprobendaten mit der Nullhypothese. Im Grund genommen handelt sich hierbei also um die Berechnung einer Wahrscheinlichkeit, einen ALPHA-Fehler zu begehen. Das heißt, mit welcher Wahrscheinlichkeit unterliegen wir einen Irrtum, wenn wir uns aufgrund der vorliegenden Daten für die Annahme der Alternativhypothese entscheiden (unter der Voraussetzung, dass in der Population die H0 gelte). Ist diese Wahrscheinlichkeit unter einem zuvor festgelegten Maß, können wir beruhigt die H1 annehmen.
Das Festlegen der Grenze, ab wann wir eine Nullhypothese verwerfen obliegt dem Forscher. Je nach Konsequenzen und Folgen des Begehens eines ALPHA-Fehlers wird man diese Grenze niedriger oder höher ansetzen. Sind die Folgen eines solchen Fehlers nicht weiter schlimm, so setzt man die Grenze üblicherweise bei 5% an (man spricht dann auch von einem signifikanten Ergebnis). Sind die Konsequenzen negativ, so legt man die Grenze bei 1% (hoch signifikantes Ergebnis) oder darunter fest.
Achtung: Bei der Berechnung der Irrtumswahrscheinlichkeit handelt sich sozusagen um eine "bedingte" Wahrscheinlichkeit: P(Ergebnis|H0 gilt) (sprich: die Wahrscheinlichkeit für dieses Stichprobenergebnis unter der ANNAHME, dass die H0 gelte).

Berechnung der Irrtumswahrscheinlichkeit

Die Berechnung der Irrtumswahrscheinlichkeit sei an einem Beispiel erklärt werden: Ein besonders motivierter, junger Statistiker wird mit der Leitung einer Lehrveranstaltung betraut. Großspurig verkündet er, durch den Einsatz neuer Medien, die Vermittlung von Statistik fundierter gestalten zu können. Davon sollen die Studenten im Sinne eines besseren Verständnisses der Inhalte profitieren. Aus jahrelanger Erfahrung weiß man an der Universität, dass Studenten der Statistik im Mittel 24 Punkte auf einem standardisierten Multiple-Choice-Test erreichen. Die Streuung betrage 8 Punkte. Aufgrund der jahrelangen Erfahrung (zahlreiche Einzel"untersuchungen"), können diese Werte zur Schätzung der Populationsparameter heran gezogen werden. Der motivierte Lektor unterrichtet nun 2 Gruppen mit insgesamt 70 Studenten. Am Ende des Semesters stellt sich heraus, dass seine Studenten im Schnitt 28 Punkte auf dem standardisierten Test erreichen. Kann nun von einem signifikantem Unterschied gesprochen werden?

In diesem Zusammenhang stellen sich noch mehr Fragen: Wirkt hier die besondere Fähigkeit des Lektors, Inhalte zu vermitteln? Wirkt hier tatsächlich seine neue Lernmethode? Sind die Studenten repräsentativ für alle Studierenden (unterrichtet er z.B. nur ältere, berufstätige Studierende)? Von diesen und weiteren Überlegungen hängt schließlich das Untersuchungsdesign ab. Hier soll aber nun das Konzept der Signifikanz geklärt werden.

Aus Kapitel 1 wissen wir, dass sich Mittelwerte hinreichend großer Stichproben normalverteilen mit Mittelwert µ0=24. Dies natürlich unter der Annahme der Nullhypothese. Wie wahrscheinlich ist nun ein Ergebnis (Mittelwert!) von 26 Punkten?

Dazu nun folgende Überlegung: Ziehen wir sehr viele Stichproben eines bestimmten Umfangs (z.B. n=70) von Studenten, die nach der herkömmlichen Methode unterrichtet wurden, so erhalten wir die beschriebene Stichprobenkennwerteverteilung. Manche dieser Stichproben werden einen besseren Mittelwert als 28 erzielen, manche einen schlechteren (für den Lektor "günstige", weil seine Alternativhypothese ja lautete, seine Methode würde zu besseren Ergebnissen führen). Dividieren wir nun die Anzahl der "günstigen" Stichproben durch die Gesamtanzahl der (fiktiv) gezogenen Stichproben, so hätten wir eine Wahrscheinlichkeit für einen ALPHA-Fehler (Irrtumswahrscheinlichkeit) ermittelt.

Da dies in der Praxis nicht möglich ist, nehmen wir an:

(1) dass die Verteilung Mittelwert µ0=24 hat
(2) die Verteilung hat die Streuung (Standardfehler): 0,96 (gerundet)
(3) es sich um eine Normalverteilung handelt (zentrales Grenzwerttheorem).

ad (2) Setzten Sie in die Formel von Kapitel 1.3 für σ=8 und n=70 ein!

Wir müssen nunmehr nur noch den kritischen z-Wert der Standardnormalverteilung berechnen, dem der gefundene Mittelwert in der Zufallsverteilung der Mittelwerte (MW = 24 und SD = 0,96) entspricht. Wir ziehen von 26 den Mittelwert (24) ab und dividieren diesen Wert durch SD (0,96) und erhalten: 2,08.

Dieser Wert schneidet 1,02% der Normalverteilungsfläche ab. Das ist die Wahrscheinlichkeit für das Auftreten dieses Werts unter der Annahmen, die H0 sei gültig. Das Ergebnis steht nur sehr schwer in Einklang mit der H0. Wir verwerfen sie daher und bestätigen (vorläufig!) die Hypothese des motivierten Lektors.

Bei empirischen Untersuchungen ist im Vorhinein (a priori) eine Grenze für die Wahrscheinlichkeit anzugeben, aber der wir von einem signifikanten Ergebnis sprechen. In den Sozialwissenschaften ist dies in der Regel 5%. Liegt die Irrtumswahrscheinlichkeit darunter, sprechen wir von einem signifikantem Ergebnis. Die Festlegung dieser Grenze ist allerdings auch von den Folgen einer irrtümlichen Entscheidung abhängig: Sind diese z.B. sehr gravierend (kostspielig o.Ä.), so werden wir die Grenze herabsetzen (1%, 0,1%).
Lernstoff
 
2.5 Zum Schluss...
... sei noch auf folgendes hingewiesen:

(1) Mit dem oben durchgeführten Signifikanz hat der motivierte Lektor nichts "bewiesen", sondern nur einen Wahrscheinlichkeitswert für sein Ergebnis (unter der Annahme, dass in Wirklichkeit ein anderes gelte) berechnet.

(2) Es bleibt jedem unbenommen, über den Effekt seiner Methode zu urteilen. Ist dieser ausreichend für die Rechtfertigung einer neuen (vielleicht teureren) Methode? In hinreichend großen Stichproben werden oft auch kleine Unterschiede signifikant, die in der Praxis allerdings nicht von Bedeutung wären und einen Mehraufwand nicht rechtfertigen würden. So legt man oft so genannnte Effektgrößen fest, z.B. hätte man oben behaupten können (aufgrund sachlogischer Überlegungen), erst eine Differenz von 4 Punkten sei auch tatsächlich relevant. Sei diese Differenz signifikant, so könne man einen Umstieg auf eine teurere Methode rechtfertigen etc.

Zu guter letzt seien Ihnen nochmals die im Literaturverzeichnis angeführten Standardwerke ans Herz gelegt, v.a. Bortz/Döring: Evaluation...
 
Lernpfadseite als User öffnen (Login)

Falls Sie noch kein registrierter User sind, können Sie sich einen neuen Zugang anlegen. Als registrierter User können Sie ein persönliches Lerntagebuch zu diesem Lernpfad anlegen.

 Zur Galerie
 Zu den Mathematischen Hintergründen
 Zum Lexikon
 Zu den interaktiven Tests
 Zu den Mathe-Links und Online-Werkzeugen
 Zur Welcome Page
   Übersicht über die Lernpfade
 Open Studio Materialien
 Open Studio Eingang
 Neuen Zugang anlegen
 Login