Bildbeschreibung und Urheberrecht

Hypothesentest

Fachworte, Beispiel, Durchführung

In der Statistik ist ein Hypothesentest ein Entscheidungskriterium zwischen einer alten, bisherigen und einer neuen, möglicherweise besseren Hypothese. Die Grundidee ist es, unter Annahme der alten Hypothese durchzurechnen, wie wahrscheinlich bestimmte unerwartete Ergebnisse sind. Werden sie für die alte Hypothese zu unwahrscheinlich, wechselt man zur Alternativhypothese.

Fachworte

◦ Die alte Hypothese, von der man im Moment ausgeht => Nullhypothese
◦ Die neue Hypothese, zu der man wechseln könnte => Alternativhypothese
◦ Fälschliches Verbleiben bei der Nullhypothese => Fehler erster Art
◦ Fälschliches Wechseln zur Alternativhypothese => Fehler zweiter Art
◦ Maximal akzeptabler Fehler erster Art => Signifikanzniveau
◦ Werte für k, für die man bei der Nullhypothese bleibt => Annahmebereich
◦ Werte für k, für die man zu Alternativhypothese wechselt => Ablehnungsbereich

Hypothesen

Forscher haben oft Ideen oder Vermutungen. Bei einer Vermutung weiß man noch nicht sicher, ob sie stimmt. Deshalb überlegen sich Forscher oft, wie man die Vermutung überprüfen kann. Eine Vermutung, die man wissenschaftlich überprüfen will, nennt man eine Hypothese. Eine Möglichkeit das zu tun ist ist ein statistischer Hypothesentest. Dieser wird hier kurz am Beispiel eines Tests für Allgemeinwissen erklärt.

1. Schritt

Forschungsfrage beschreiben: Nehmen wir an, man will herausfinden, ob Erwachsene in Deutschland ein vernünftiges Allgemeinwissen haben. Man könnte einen Mini-Test dazu entwerfen:

◦ Kommt Pfingsten immer nach Ostern? ja/nein
◦ War im Jahr 1700 noch Mittelalter? ja/nein
◦ Ist Quecksilber ein Metall? ja/nein
◦ Ist der Mond ein Planet? ja/nein

2. Schritt

Forschungshypothese formulieren: Man nimmt an, dass die Deutschen ein vernünftiges Allgemeinwissen haben. Um es statistisch überprüfbar zu machen, müssen man es "messbar" machen. Man legt (willkürlich) fest: Wer mindestens die Hälfte der Fragen im Test oben richtig beantwortet, hat ein vernünftiges Allgemeinwissen. Die Forschungshypothese wäre dann zum Beispiel: "Mehr als die Hälfte der Erwachsenen Deutschen würden den Test oben bestehen und hat damit ein vernünftiges Allgemeinwissen".

3. Schritt

Null- und Alternativhypothese festlegen: In der Sprache des statistischen Hypothesentests ist die eigentliche Forschungshypothese (um die es ja geht) die "Alternativhypothese". Ihr Gegenteil nennt man die Nullhypothese. Man schreibt am besten immer beide in ganzen Sätzen erst einmal hin:

Nullhypothese: "Die Hälfte der erwachsenen Deutschen würde den Test nicht bestehen."
Alternativhypothese: "Die Hälfte der erwachsenen Deutschen würde den Test bestehen."

4. Signifikanzniveau festlegen

Das Signifikanzniveau sagt mir, mit welcher Wahrscheinlichkeit man eine Alternativhypothese für richtig hält, obwohl sie in Wirklichkeit falsch ist. Falsch meint hier, dass das Ergebnis durch bloßen Zufall, also oben durch bloßes Raten, zustande kam. Das Signifikanzniveau wird dabei nicht irgendwie berechnet. Man legt es willkürlich fest. Je mehr Gewissheit man will, dass die Alternativhypothese wirklich stimmt, desto kleiner sollte das Signifikanzniveau sein. Es wird oft auch Irrtumswahrscheinlichkeit genannt. Oft nimmt man 5 Prozent. Am Beispiel oben: Wenn mein Signifikanzniveau 5 % ist, dann heißt das, dass ich in etwa 5 % der durchgeführten Tests jemandem Allgemeinwissen bescheinige, obwohl er gar keines hat.

5. Fehlerarten formulieren

Fehler 1. Art: Man entscheidet sich für die Alternativhypothese obwohl sie tatsächlich falsch ist.

Fehler 2. Art: Man entscheidet sich für die Nullhypothese, obwohl sie tastsächlich falsch ist.

Der Fehler erster Art entspricht dabei dem Signifikanzniveau. Will man den Fehler erster Art klein halten, macht man sein Signifikanzniveau niedrig. Dadurch aber wird die Wahrscheinlichkeit für einen Fehler zweiter Art größer. Aus diesem Dilemma gibt es keinen Ausweg. Die Wahrscheinlichkeit für einen Fehler zweiter Art kann man nur berechnen, wenn man die echten Werte aus der Wirklichkeit kennt. Im Beispiel mit dem Allgemeinwissen, würde das heißen, dass man für alle erwachsenen Deutschen sicher weiß, ob sie den Test oben bestehen würden oder nicht. Die Wahrscheinlichkeit für einen Fehler erster Art kann man durch Wahrscheinlichkeitsrechnungen bestimmen.

Motivation

Angenommen man redet zuhause über einen verstopften Abfluss. Das Internet wurde während des Redens nicht benutzt. Auch hat man keine Internetrecherche zu Abflüssen oder Verstopfungen durchgeführt. Verblüffenderweise erhält man am nächsten Morgen eine Werbemaile mit "Abflussreiniger-Stäbchen". Solche sinntragenden Zeitgleichheiten nennt man Synchronizitäten. Unmittelbar stellt sich die Vermutung ein, dass irgendwo im Haus die eigenen Gespräche mitgehört werden. Denkbar wäre aber auch, dass alles im Rahmen normaler Zufallschwankungen liegt: Angenommen ein Spammer hat 5 Millionen solcher Mails in Deutschland verschickt. Gleichzeitig gab es an den Tagen davor vielleicht etwa 50 Tausend Leute, die sich über Verstopfungen unterhielten. Jede dieser 50 Tausend Personen würde sich dann über die passende Spam-Mail wundern, obwohl alles nur reiner Zufall war. Hypothesentests helfen abzuschätzen, inwiefern etwas noch rein zufällig war oder eine tiefere Ursache hat.

Schluss

Bei dem Beispiel mit dem Test zum Allgemeinwissen sieht die Sache so aus: durch bloßes Raten würde man im Schnitt die Hälfte der Fragen richtig beantworten können. Probiere es selbst einmal mit Würfeln aus: Du gehst die Fragen durch und würfelst. Würfelst du eine gerade Zahl, antwortest du "ja", bei einer ungeraden Zahl antwortest du mit "nein". Wenn du den Test öfters machst, wirst du merken, dass du ihn im Schnitt in der Hälfte der Fälle mit Würfeln bestehst. Wir hätten mit dem Test also eine 50%-ige Wahrscheinlichkeit, unsere Hypothese über die vorhandene Allgemeinbildung anzunehmen, obwohl die Prüflinge vielleicht nur geraten haben, also gar kein echtes Allgemeinwissen haben. Genau das wäre der Fehler erster Art: Wir nehmen unsere Hypothese an, obwohl sie falsch ist. Der Test oben wäre also nicht besonders zuverlässig.

Synonyme

=> Statistischer Test
=> Signifikanztest
=> Hypothesentest

Siehe auch

=> Fehler erster Art
=> Fehler zweiter Art
=> Synchronizitäten
=> Mittelalter
=> Quecksilber
=> Statistik
=> Pfingsten
=> Mond