dass sich die Balken biegen...

Lernpfad erstellt und betreut von:

die_normalverteilten

E-mail: reinhard.raml@univie.ac.at
Homepage: http://www.univie.ac.at/soziologie-statistik/
Steckbrief
Kurs-Informationen
Ansicht mit Navigations-Frame
Lernpfadseite als User öffnen (Login)
Lernpfadseite bearbeiten (Autor)

Übersicht:       
Hilfe
1. Kernthemen
2. Weiterführendes

Kernthemen
 
1.1 Zusammenfassung der wesentlichen Inhalte
http://mathe-online.at/materialien/reinhard.raml/files/unterlage_manipulation.doc

Unter dem angegebenen Link finden Sie eine übersichtliche und nach Kapiteln geordnete Zusammenfassung der in diesem Lernpfad behandelten Themen. Es ist daher sinnvoll, sich die Datei herunter zu laden und bei Bedarf nachzulesen.
Die untenstehenden Texte finden Sie daher in dieser Datei zusammengestellt!
Zusammenfassung
 
1.2 Begegnungen im Alltag
Viel zu oft benutzen wir Statistik "wie ein Betrunkener einen Laternenpfahl: vor allem zur Stütze unseres Standpunktes und weniger zum Beleuchten eines Sachverhaltes." (Andrew Lang).
Statistiken und grafisch aufbereitetes statistisches Material begegnen uns ständig im Alltag. Sei es durch Kommunikation unter Freunden, der Blick in die Tageszeitung oder die Kurznachrichten im Fernsehen. Wie häufig dabei das Material fehlerhaft oder dessen Aussage relativ ist, fällt uns oft gar nicht auf.
Denken Sie über die (weitreichenden?) Folgen (bewusst?) falsch verbreiteter statistischer Information nach! Machen Sie diesbezüglich stichwortartige Einträge in Ihr Lerntagebuch!
Eintrag in das Lerntagebuch
 
1.3 Die Definition entscheidet...
Lügen mit Statistik beginnt nicht bei der Analyse und Aufbereitung von gesammelten Daten, sondern meist schon viel früher – bei der Definition von Begriffen. Zu jeder wissenschaftlichen Untersuchung gehört die Definition von verwendeten Begriffen, sofern diese nicht in einem allgemeinen Konsens bereits definiert wurden. Bei zahlreichen Begriffen ist dies jedoch nicht der Fall, z.B. Arbeitslosigkeit, Ausländer, Geburtenrate, Tourist, Wohnung, Ureinwohner, Armut, Wohlstand, Wirtschaftswachstum, Schulbildung, Kriminalität, Analphabetismus, Streik, Säuglingssterblichkeit etc. Solange die gewählten Definitionen plausibel (und konsensfähig) erscheinen ist nichts gegen eine begriffliche Vielfalt einzuwenden (auch wenn sie mitunter mühsam ist), die Manipulation beginnt jedoch dann, wenn Begriffe bewusst so bestimmt werden, damit sich das Ergebnis mühelos in das eigene Weltbild einfügen lässt.
Definieren Sie die Begriffe "Kriminalität" und "Analphabetismus" .
Schreiben Sie diese in Ihr Lerntagebuch! Anschließend stellen Sie Ihre Definiton ins Forum und vergleichen diese mit Ihren KollegInnen!
Lernstoff, Eintrag in das Lerntagebuch
 
1.4 Basis
http://mathe-online.at/materialien/reinhard.raml/files/aufgabe_selbstmordraten.doc

Prozentangaben sind das Um und Auf in der deskriptiven Statistik und haben es per definitionem in sich, dass sie sich auf eine bestimmte Basis (Nenner) beziehen. Je nach gewählter Basis werden große Prozentwerte plötzlich ganz klein. Viele Prozentangaben in der Tageszeitung und daraus gezogene spektakuläre Schlussfolgerungen sind oftmals nichts anderes als grob fahrlässig verursachte Irrtümer. Kann man z.B. aus der Tatsache, dass in den USA die meisten Gewaltverbrechen zu Hause geschehen, schließen, dass man am sichersten im Central Park schläft? Wohnungen sind nicht zwingend ein gefährliches Pflaster, sondern wir halten uns nun mal die meiste Zeit dort auf (deshalb passieren auch so viele Unfälle im eigenen Heim). Oder: Krankenhäuser sind lebensgefährlich (die Hälfte aller Österreicher stirbt dort). Weiter: Rasen ist nicht gefährlich, es sterben viel mehr Personen bei Unfällen mit Tempo 50 km/h. Diese Schlussfolgerungen sind offensichtlich nicht korrekt, manchmal ist der Irrtum aber nicht so einfach zu erkennen:
Ein Politiker fordert die Einführung einer Pflichtversicherung für Radfahrer. Zur Begründung verweist er auf eine Statistik, die besagt, dass Radfahrer ein Drittel aller (registrierten) Sportunfälle verursachen. Das mag eine ganz korrekte Aussage sein, sie kann aber auch gar nichts besagen. Ohne weitere Informationen ist sie nutzlos. Um sie beurteilen zu können, müssen wir wissen, welchen Anteil die Radfahrer an allen Sportlern des Landes überhaupt ausmachen. Ist Radfahren mit einem Anteil von 10% an allen sportlichen Aktivitäten vertreten, so könnte man obiger Forderung durchaus zustimmen. Machen die Radfahrer allerdings über die Hälfte aller Sportler aus, so relativiert sich auch ihr Anteil an allen Sportunfällen. Im Übrigen sind es häufig die alpinen Skifahrer, die überproportional viele Unfälle verursachen. Durch solche Überlegungen relativieren sich rasch sehr viele Aussagen.
Bearbeiten Sie nun die unter dem link angegebene Aufgabe in Ihrem Lerntagebuch!
Übungsaufgabe, Eintrag in das Lerntagebuch
 
1.5 Wertlose Maßzahlen
Je nach Datenniveau dürfen bestimmte Maßzahlen berechnet werden oder nicht (z.B. würde eine mittlere Haarfarbe keinen Sinn machen). Entscheidend für die Wahl der angemessen Maßzahl ist aber nicht nur das Datenniveau, sondern auch die Beschaffenheit der Verteilung: Sind in einer Stichprobe (wenn auch nur wenige) extreme Ausreißer zu finden, so verzerren diese das arithmetische Mittel besonders stark und lassen den Median meist unverändert.
Über Eigenschaften der Lagemaße Bescheid zu Wissen kann einem so manchen Fehltritt ersparen: So beklagte die Weltbank 1980, dass in den USA mehr als die Hälfte der Einwohner an Hunger leiden würden. Sie definierten als hungrig, wer weniger als die durchschnittliche Zahl an Kalorien zu sich nehme. Diese Definition alleine kann man schon als wenig sinnvoll bezeichnen, sie hat aber einen entscheidenden anderen Haken: Ein Durchschnitt ist im Wesen so definiert, dass in etwa die Hälfte der einbezogenen Werte darunter liegt (beim Median ist es genau die Hälfte), also verwundert es einen Statistiker wohl kaum, dass „halb Amerika hungere“.
Der Kardinalfehler in der Statistik ist allerdings die Angabe von Lagemaßen ohne ein dazu gehörendes Streuungsmaß. Viele Untergruppen (z.B. Frauen/Männer) mögen bezüglich eines bestimmten Merkmals den gleichen „Durchschnitt“ aufweisen und sind sich dennoch überhaupt nicht ähnlich. Deshalb bringen uns z.B. Durchschnittstemperaturen in der Klimatologie (in der Schule Teilgebiet der Geografie) so gut wie gar nichts, wenn wir keine Standardabweichung als Information dazu erhalten. Erst durch die Streuung kann man auch auf die Vegetation schließen: Zwei Orte mit der gleichen durchschnittlichen Jahrestemperatur können ganz unterschiedlich beschaffen sein, je nachdem wie extrem die Temperaturschwankungen sind (angegeben durch die Standardabweichung).
Vertiefung
 
1.6 Korrelation und Kausalität
Eine Korrelation zwischen zwei Merkmalen (z.B. Intelligenzquotient und Einkommen) ist ein wie auch immer gearteter Gleich- oder Widerklang dieser beiden Merkmale. Korrespondiert z.B. ein hoher Wert der einen Variablen (hoher Intelligenzquotient) mit einem hohen Wert der anderen Variable (hohes Einkommen), so spricht man von einer positiven Korrelation (Gleichklang). Eine negative Korrelation (Widerklang) liegt vor, wenn z.B. mit steigendem Intelligenzquotienten das Einkommen sinken würde.
Durch das gemeinsame Variieren der Variablen kann aber nicht auf einen Ursache-Wirkung-Mechanismus geschlossen werden. Es ist nicht ohne weiteres aus einer positiven Korrelation zu schließen, dass ein hoher Intelligenzquotient ein hohes Einkommen bedingt („verursacht“). Vielmehr könnte hinter diesem Zusammenhang eine dritte Variable (eine so genannte intermittierende Variable bzw. Moderatorvariable ) stecken, welche die beiden positiv korrelierten Merkmale systematisch beeinflusst. Dies könnte in unserem Fall die Variable „Einkommen der Eltern“ sein. Man könnte annehmen, dass reiche Eltern ihre Kinder mehr fördern, auch im Hinblick auf die Intelligenz des Kindes, außerdem arbeiten sie in guten Positionen und können so ihren Kindern gut bezahlte Jobs vermitteln. In dieser Argumentation sind sehr viele umstrittene Annahmen eingebaut worden, um zu demonstrieren, dass das Interpretieren in der Statistik alles andere als einfach und eindeutig ist. Es ist ein Irrglaube, anzunehmen, dass Zahlen eine eindeutige Sprache sprächen.

Es wurden in zahlreichen Untersuchungen folgende Korrelationen festgestellt:
Anzahl der Störche und Anzahl der Geburten (pos. Korr.),
Ausländeranteil und Kriminalitätsrate (pos. Korr.),
Luftqualität und Sterberate (pos. Korr.),
Heuschnupfen und Weizenpreis (neg. Korr.)!

Welche Moderatorvariablen könnten für diese (kuriosen) Zusammenhänge verantwortlich sein? Könnte auch eine Kausalität vorliegen, z.B. der Schluss, Ausländer seien krimineller – die Statistik beweist es (wieder einmal)?
Lernstoff, Übungsaufgabe, Eintrag in das Lerntagebuch
 
Lernpfadseite als User öffnen (Login)

Falls Sie noch kein registrierter User sind, können Sie sich einen neuen Zugang anlegen. Als registrierter User können Sie ein persönliches Lerntagebuch zu diesem Lernpfad anlegen.

 Zur Galerie
 Zu den Mathematischen Hintergründen
 Zum Lexikon
 Zu den interaktiven Tests
 Zu den Mathe-Links und Online-Werkzeugen
 Zur Welcome Page
   Übersicht über die Lernpfade
 Open Studio Materialien
 Open Studio Eingang
 Neuen Zugang anlegen
 Login