Bildbeschreibung und Urheberrecht

Hypothesentest


Fachworte, Beispiel, Durchführung


Basiswissen


In der Statistik ist ein Hypothesentest ein Entscheidungskriterium zwischen einer alten, bisherigen und einer neuen, möglicherweise besseren Hypothese. Die Grundidee ist es, unter Annahme der alten Hypothese durchzurechnen, wie wahrscheinlich bestimmte unerwartete Ergebnisse sind. Werden sie für die alte Hypothese zu unwahrscheinlich, wechselt man zur Alternativhypothese.

Fachworte


◦ Die alte Hypothese, von der man im Moment ausgeht => Nullhypothese
◦ Die neue Hypothese, zu der man wechseln könnte => Alternativhypothese
◦ Fälschliches Verbleiben bei der Nullhypothese => Fehler erster Art
◦ Fälschliches Wechseln zur Alternativhypothese => Fehler zweiter Art
◦ Maximal akzeptabler Fehler erster Art => Signifikanzniveau
◦ Werte für k, für die man bei der Nullhypothese bleibt => Annahmebereich
◦ Werte für k, für die man zu Alternativhypothese wechselt => Ablehnungsbereich

Hypothesen


Forscher haben oft Ideen oder Vermutungen. Bei einer Vermutung weiß man noch nicht sicher, ob sie stimmt. Deshalb überlegen sich Forscher oft, wie man die Vermutung überprüfen kann. Eine Vermutung, die man wissenschaftlich überprüfen will, nennt man eine Hypothese. Eine Möglichkeit das zu tun ist ist ein statistischer Hypothesentest. Dieser wird hier kurz am Beispiel eines Tests für Allgemeinwissen erklärt.

1. Schritt


Forschungsfrage beschreiben: Nehmen wir an, man will herausfinden, ob Erwachsene in Deutschland ein vernünftiges Allgemeinwissen haben. Man könnte einen Mini-Test dazu entwerfen:

◦ Kommt Pfingsten immer nach Ostern? ja/nein
◦ War im Jahr 1700 noch Mittelalter? ja/nein
◦ Ist Quecksilber ein Metall? ja/nein
◦ Ist der Mond ein Planet? ja/nein

2. Schritt


Forschungshypothese formulieren: Man nimmt an, dass die Deutschen ein vernünftiges Allgemeinwissen haben. Um es statistisch überprüfbar zu machen, müssen man es "messbar" machen. Man legt (willkürlich) fest: Wer mindestens die Hälfte der Fragen im Test oben richtig beantwortet, hat ein vernünftiges Allgemeinwissen. Die Forschungshypothese wäre dann zum Beispiel: "Mehr als die Hälfte der Erwachsenen Deutschen würden den Test oben bestehen und hat damit ein vernünftiges Allgemeinwissen".

3. Schritt


Null- und Alternativhypothese festlegen: In der Sprache des statistischen Hypothesentests ist die eigentliche Forschungshypothese (um die es ja geht) die "Alternativhypothese". Ihr Gegenteil nennt man die Nullhypothese. Man schreibt am besten immer beide in ganzen Sätzen erst einmal hin:

Nullhypothese: "Die Hälfte der erwachsenen Deutschen würde den Test nicht bestehen."
Alternativhypothese: "Die Hälfte der erwachsenen Deutschen würde den Test bestehen."

4. Signifikanzniveau festlegen


Das Signifikanzniveau sagt mir, mit welcher Wahrscheinlichkeit man eine Alternativhypothese für richtig hält, obwohl sie in Wirklichkeit falsch ist. Falsch meint hier, dass das Ergebnis durch bloßen Zufall, also oben durch bloßes Raten, zustande kam. Das Signifikanzniveau wird dabei nicht irgendwie berechnet. Man legt es willkürlich fest. Je mehr Gewissheit man will, dass die Alternativhypothese wirklich stimmt, desto kleiner sollte das Signifikanzniveau sein. Es wird oft auch Irrtumswahrscheinlichkeit genannt. Oft nimmt man 5 Prozent. Am Beispiel oben: Wenn mein Signifikanzniveau 5 % ist, dann heißt das, dass ich in etwa 5 % der durchgeführten Tests jemandem Allgemeinwissen bescheinige, obwohl er gar keines hat.

5. Fehlerarten formulieren


Fehler 1. Art: Man entscheidet sich für die Alternativhypothese obwohl sie tatsächlich falsch ist.

Fehler 2. Art: Man entscheidet sich für die Nullhypothese, obwohl sie tastsächlich falsch ist.

Der Fehler erster Art entspricht dabei dem Signifikanzniveau. Will man den Fehler erster Art klein halten, macht man sein Signifikanzniveau niedrig. Dadurch aber wird die Wahrscheinlichkeit für einen Fehler zweiter Art größer. Aus diesem Dilemma gibt es keinen Ausweg. Die Wahrscheinlichkeit für einen Fehler zweiter Art kann man nur berechnen, wenn man die echten Werte aus der Wirklichkeit kennt. Im Beispiel mit dem Allgemeinwissen, würde das heißen, dass man für alle erwachsenen Deutschen sicher weiß, ob sie den Test oben bestehen würden oder nicht. Die Wahrscheinlichkeit für einen Fehler erster Art kann man durch Wahrscheinlichkeitsrechnungen bestimmen.

Motivation


Angenommen man redet zuhause über einen verstopften Abfluss. Das Internet wurde während des Redens nicht benutzt. Auch hat man keine Internetrecherche zu Abflüssen oder Verstopfungen durchgeführt. Verblüffenderweise erhält man am nächsten Morgen eine Werbemaile mit "Abflussreiniger-Stäbchen". Solche sinntragenden Zeitgleichheiten nennt man Synchronizitäten. Unmittelbar stellt sich die Vermutung ein, dass irgendwo im Haus die eigenen Gespräche mitgehört werden. Denkbar wäre aber auch, dass alles im Rahmen normaler Zufallschwankungen liegt: Angenommen ein Spammer hat 5 Millionen solcher Mails in Deutschland verschickt. Gleichzeitig gab es an den Tagen davor vielleicht etwa 50 Tausend Leute, die sich über Verstopfungen unterhielten. Jede dieser 50 Tausend Personen würde sich dann über die passende Spam-Mail wundern, obwohl alles nur reiner Zufall war. Hypothesentests helfen abzuschätzen, inwiefern etwas noch rein zufällig war oder eine tiefere Ursache hat.

Siehe auch


=> Versuch Allgemeinwissen
=> Metall-Riech-Versuch
=> Bernoulli-Kette





© Lernwerkstatt Aachen GbR, 2020