t-Test einfach erklärt

Einleitung


Der t-Test gehört zu den Hypothesentests und wendet diesen auf die t-Verteilung an. Mit ihm kann man eine signifikante Abweichung zweier Stichprobenmittelwerte voneinander oder die Abweichung eines Mittelwertes von einem extern vorgegebenen Wert testen

In diesem Artikel wird der t-Test und seine Verteilung, Testarten, Berechnung sowie Interpretation erklärt.

t-Verteilung, Hypothesentest und Freiheitsgrade


Bevor wir auf den t-Test eingehen, müssen zuerst ein paar wichtige Begriffe erklärt werden.

  • Mit dem t-Test lassen sich Hypothesentests über Mittelwerte durchführen, wenn die Daten aus einer t-Verteilung stammen.

In diesem Satz stecken bereits zwei wichtige Begriffe: die t-Verteilung und der Hypothesentest. Außerdem ist der Begriff der Freiheitsgrade relevant.

t-Verteilung

Eine t-Verteilung wird auch, nach dem Pseudonym ihres Entwicklers, als Student t-Verteilung bezeichnet. Nahezu jede Wahrscheinlichkeitsverteilung wird durch den Mittelwert und die Standardabweichung von Stichprobe und Grundgesamtheit charakterisiert.

t-Verteilung einfach erklärt

Die t-Verteilung kann eingesetzt werden, wenn man die Standardabweichung der Grundgesamtheit nicht kennt. Die Standardabweichung wird in diesem Fall durch die Standardabweichung der Stichprobe geschätzt.

Einfach gesagt, kann man sie also bereits immer dann verwenden, wenn nur die Werte der Stichprobe bekannt sind. Dies ist in der Praxis oft der Fall. Daher ist die t-Verteilung eine sehr sinnvolle Hilfe, wenn eine Anwendung der Normalverteilung nicht möglich ist, weil die Standardabweichung der Grundgesamtheit fehlt.

Hypothesentest

Hypothesentets einfach erklärt

Hypothesentests bedeuten einfach gesagt, man stellt eine Annahme – eine sogenannte Hypothese – auf und prüft diese statistisch auf ihr Zutreffen.

Hypothesen können gerichtet (Abweichung nach oben oder unten) oder ungerichtet (Abweichung unabhängig von der Richtung) sein.

Eine Hypothese wird immer entgegen der eigentlichen Annahme aufgestellt und geprüft. Abhängig davon wird sie entweder angenommen oder verworfen. Da es in der Statistik nie eine 100%ige Sicherheit gibt, besteht immer eine gewisse Wahrscheinlichkeit, bei der Entscheidung über die Hypothese falsch zu liegen. Diese Wahrscheinlichkeit wird als sogenannte Irrtumswahrscheinlichkeit oder Signifikanzniveau bezeichnet.

Freiheitsgrade

Der dritte relevante Begriff nennt sich Freiheitsgrade.

Freiheitsgrade einfach erklärt

Freiheitsgrade geben an, wie viele Werte in einer Berechnungsformel frei variieren dürfen, damit sie berechenbar ist.

Kennt man beispielsweise die Summe aus drei Werten a, b und c, können die beiden Werte a und b frei variieren und der dritte Wert c ergibt sich als fehlender Wert. Man spricht von einem Freiheitsgrad von zwei. Freiheitsgrade berechnen sich also als:

Formel Freiheitsgrade

Arten von t-Tests


Je nachdem ob man eine oder zwei Stichproben testet, spricht man vom Einstichprobentest oder vom Zweistichprobentest. Letzter lässt sich noch weiter unterscheiden, je nachdem ob die Stichproben voneinander abhängig sind oder nicht.

Arten von t-Tests

Einstichprobentest

Einstichprobentest einfach erklärt

Beim Einstichprobentest wird der Mittelwert einer Stichprobe mit einem extern gegebenen Wert verglichen.

Dieser Wert kann beispielsweise der Mittelwert der Grundgesamtheit, ein vorgegebener Wert oder eine allgemeine ungerichtete Untersuchung auf systematische Abweichungen sein. Beispielsweise vermuten wir, dass in Chipstüten zu wenig Inhalt enthalten ist. Wir nehmen eine Stichprobe und vergleichen den durchschnittlichen Inhalt mit dem Sollwert von 200g.

Zweistichprobentest für unverbundene Stichproben

Zweistichprobentest für unverbundene Stichproben einfach erklärt

Beim Zweistichprobentest werden die Mittelwerte zweier Stichproben verglichen. Beim Test für unverbundene Stichproben, sind die beiden Stichproben voneinander unabhängig.

Der t-test lässt sich in diesem Fall nur durchführen, wenn beide Stichproben dieselbe angenommene Varianz haben. Ein Beispiel hierfür wäre, dass wir stichprobenartig die Durchschnittseinkommen aus zwei verschiedenen Städten miteinander vergleichen. Getestet werden würde, ob die Menschen in einer Stadt mehr oder weniger verdienen als in der anderen.

Zweistichprobentest für verbundene Stichproben

Zweistichprobentest einfach erklärt

Beim Zweistichprobentest für verbundene Stichproben sind die beiden Stichproben voneinander abhängig.

Eine solche Abhängigkeit ergibt sich beispielsweise, weil man dieselbe Stichprobe zu zwei verschiedenen Zeitpunkten miteinander vergleicht, ein klassischer Vorher-Nachher Test also. Beim Beispiel mit dem Einkommen würde uns also interessieren, ob sich das Einkommen in einer Stadt nach fünf Jahren erhöht hat oder nicht.

Voraussetzungen für den t-Test


Damit ein t-Test sinnvolle Ergebnisse liefert, müssen einige Kriterien erfüllt sein:

  • Die untersuchten Werte müssen intervall- oder ratioskaliert sein
  • Die Stichproben sind zufällig genommen worden und außer beim Test für verbundenen Stichproben besteht keine Abhängigkeit
  • Die Stichprobe muss eine Mindestgröße von n= 30 haben oder bei kleineren n annährend normalverteilt sein

Durchführung des t-Tests


Vor Beginn des t-Tests müssen immer Hypothesen gegeben sein oder aufgestellt werden, die Nullhypothese H0, die man testet, und die Gegenhypothese H1.

Der t-Test lässt sich entweder manuell über Berechnung und Tabellenwerke oder über Programme wie SPSS, Excel, Google Docs oder andere Tabellenkalkulationsprogramme durchführen.

Führt man den t-Test manuell durch, berechnet man im ersten Schritt über die sogenannte Teststatistik die Prüfgröße, also den t-Wert, und vergleicht diesen anschließend mit dem dazugehörigen kritischen Wert aus dem Tabellenwerk.

Je nachdem welche Art von t-Test man durchführt, ergeben sich unterschiedliche Formeln für t.

Tabelle Testarten

Den entsprechenden Vergleichswert findet man in einer Tabelle für die t-Verteilung. Hierbei wird der Wert folgendermaßen abgelesen:

  • Freiheitsgrad: ν = n - 1
  • Signifikanzniveau: will man sich beispielsweise zu 95% sicher sein, ist das Signifikanzniveau 1- 0,95= 0,05; bei einem zweiseitigen Test teilt sich der Wert noch durch 2.

Liegt der errechnete Wert im Bereich der Nullhypothese, so wird diese beibehalten und die getroffene Annahme ist falsch. Ansonsten wird die Nullhypothese verworfen.

Einseitiger T-Test anhand eines Beispiels

Wir führen einen t-Test durch, weil wir vermuten, dass Chips Hersteller Chipsi weniger als die angegebenen 200g pro Tüte abfüllt. Mittelwert und Standardabweichung der Grundgesamtheit, also aller Chipstüten, sind uns nicht bekannt.

Wir stellen die Nullhypothese entgegen unserer Annahme auf als:

  • H0 ≥ μ0 = 200g

Und die Gegenhypothese:

  • H1 < μ0 = 200g

Wir kaufen als Stichprobe zwanzig Packungen Chips und wiegen den Inhalt. Wir gehen davon aus, dass die Füllmenge normalverteilt ist und wir so mit der t-Verteilung rechnen können:

Tabelle t-Verteilung

Wir berechnen den Mittelwert des Packungsinhaltes als 195,44g und die Standardabweichung s als 7,28g.

Wir setzen folgende Werte in die Formel ein:

Formel Beispiel t-test

Wir berechnen den t-Wert für Einstichprobentests:

Formel Beispiel t-test 2

Wir möchten mit der Entscheidung zu 95% sicher sein, also liegt die Irrtumswahrscheinlichkeit bei 5% und das Signifikanzniveau bei 0,05. In der t-Test Tabelle findet sich bei 𝛼 = 0,05 und 𝜈 = 19 ein Wert von 1,729. Da wir einen linksseitigen Test durchführen, müssen wir den Wert negativieren, erhalten also -1,729. Wir haben festgelegt, dass wir die Nullhypothese annehmen für Werte die größer oder gleich sind. -2,801 ist kleiner als -1,729 und somit lehnen wir die Nullhypothese ab und wissen, dass die Packungen mit 95%iger Sicherheit zu gering befüllt sind.

Zusammengefasst lautet unsere Entscheidung:

Formel Beispiel t-test 3

Zusammenfassung


t-Tests sind die Hypothesentests der t-Verteilung und vergleichen entweder den Mittelwert einer Stichprobe mit einem vorgegebenen Wert oder die Mittelwerte von zwei Stichproben miteinander. Im Falle einer Stichprobe spricht man von Einstichprobentest, bei zwei Stichproben von einem Zweistichprobentest für verbundenen oder unverbundene Stichproben, je nachdem ob diese voneinander abhängig sind oder nicht.

Mit Hilfe von Software oder manueller Berechnung lassen sich t-Werte berechnen, mit dem kritischen Wert vergleichen und dann Entscheidungen über die Hypothese treffen.





Lektorat Plus für eine perfekte Bachelor- oder Masterarbeit.