Normalverteilung einfach erklärt

Einleitung


Die Normalverteilung oder auch Gauß-Verteilung bzw. Gaußsche Normalverteilung ist ein elementarer Begriff aus der Stochastik. Sie ist die wichtigste Wahrscheinlichkeitsverteilung und wird zur Analyse von Daten, aber auch zur Berechnung von Wahrscheinlichkeiten hergenommen.

Im folgenden Artikel wird erklärt, was die Normalverteilung ist, wofür man sie verwendet und wie man sie interpretiert.

Anwendung


Wahrscheinlichkeitsverteilungen werden immer hergenommen, wenn man ein Zufallsexperiment modellieren, auswerten oder berechnen möchte.

Anhand der Verteilung können die Wahrscheinlichkeiten für einzelne Ausprägungen einer Zufallsvariable berechnet werden, aber auch bei Bekanntheit der Verteilung einzelne Parameter abgeleitet werden. Die Normalverteilung dient auch als Basis für weitere statistische Auswertungen wie beispielsweise t-Tests oder Regressions- und Varianzanalysen.

Tipp

Die Normalverteilung wird meist für sehr große Stichproben hergenommen oder dient als Hilfsmittel, wenn die eigentliche Verteilung unbekannt ist.

Anwendung findet sie in vielen verschiedenen Fällen in den Natur-, Geistes- oder Wirtschaftswissenschaften:

  • Biologie (Körpergröße, Länge von Gliedmaßen, Blutdruck)
  • Meteorologie (Regenmenge, Sonnenstunden)
  • Physik (Messfehler)
  • Produktion (Kapazitäten, Qualitätssicherung, Füllmenge von Packungen)
  • Gesellschaftswissenschaften (Einkommen (bei logarithmierten Werten), Intelligenz, Sozialkompetenz)
  • Finanzmarkt (Preisänderung von Aktien)

Die Funktion der Normalverteilung


Die Normalverteilung kann einerseits als Verteilung, als Verteilungsfunktion oder als grafische Darstellung vorkommen. Die Normalverteilung hat eine sehr charakteristische Form, weshalb sie auch Glockenkurve oder Gaußsche Glockenkurve genannt wird.

Wichtige Bestandteile der Formel sind die Variable x, der Erwartungswert µ und die Varianz σ² bzw. die Standardabweichung σ. Die Normalverteilung errechnet sich anhand folgender Formel:

Formel Normalverteilung
Parameter Normalverteilung

Sind Erwartungswert µ = 0 und Standardabweichung σ =1, so spricht man von der sogenannten Standardnormalverteilung. Diese wird auch oft mit dem griechischen Buchstaben ϕ (phi) angegeben.

Standardnormalverteilung

Sind die Werte µ und σ ungleich 0 ergeben sich quasi unendlich viele Varianten der Normalverteilung.

Im Folgenden zeigen wir zwei weitere Ausprägungen von µ und deren Auswirkung auf den Graphen.

Standardnormalverteilung 2

Die blaue Kurve zeigt die Standardnormalverteilung mit µ = 0 und σ =1. Die rote Kurve zeigt einen Mittelwert von µ =1 bei σ = 1 und die graue Kurve einen Wert von µ = -1 bei σ =1.

Im Folgenden veranschaulichen wir unterschiedliche Standardabweichungen:

Standardnormalverteilung 3

Die blaue Kurve zeigt wieder die Standardnormalverteilung mit µ = 0 und σ =1. Die rote Kurve zeigt eine Standardabweichung von σ = 0,5 und die graue Kurve einen Wert σ =2, beide bei einem Erwartungswert von µ = 0.

Nun kombinieren wir beide Parameter miteinander:

Standardnormalverteilung 4

Die blaue Kurve zeigt wieder eine Standardnormalverteilung mit µ = 0 und σ =1. Die rote Kurve zeigt eine Verschiebung von µ = 0 auf µ = 2 und eine Stauchung von σ =1 auf σ =2. Der Mittelwert liegt somit höher, gleichzeitig auch die Streuung. Der schwarze Graph wiederum zeigt eine Verschiebung von µ = 0 auf µ = -1 und eine Streckung von σ =1 auf σ = 0,8, also eine geringere Streuung. Auf diese Weise ergeben sich unendlich viele mögliche Ausprägungen der Normalverteilung.

Weitere Besonderheiten der Normalverteilung

- Die Normalverteilung ist stets symmetrisch mit einer Symmetrieachse bei x = µ.

- Die Fläche bzw. das Integral unter der Kurve von - ∞ bis + ∞ ist stets 1. Dies bedeutet, dass die Wahrscheinlichkeit aller Ausprägungen dieser Verteilung in Summe 1, also 100%, ist.

- Die Normalverteilung ist eine stetige Wahrscheinlichkeitsverteilung, das heißt, dass – theoretisch – alle reellen Zahlen als Ausprägung von x möglich sind.

Der zentrale Grenzwertsatz


Durch den zentralen Grenzwertsatz lässt sich erklären, warum die Normalverteilung so vielfältig anwendbar ist.

Grenzwertsatz einfach erklärt

Der Grenzwertsatz sagt aus, dass wenn man nur eine ausreichend große Anzahl an Zufallsvariablen aus derselben Verteilung (unabhängig von der Art der Verteilung) nimmt, diese immer annähernd normalverteilt sein werden.

Der Mittelwert der Stichprobe wird dann immer näherungsweise dem Mittelwert der Grundgesamtheit entsprechen, genau wie die Varianz.

Die 68 – 95 – 99,7 Regel


  • Die 69-95-99,7 Regel gibt Aufschluss darüber, wie viel Prozent der Ausprägungen im Rahmen von ein, zwei oder drei Standardabweichungen liegen.

Konkret bedeutet dies, dass bei einer Normalverteilung 68% aller Ausprägungen im Rahmen einer Standardabweichung nach oben nach unten um den Erwartungswert liegen. 95% aller Werte streuen im Rahmen von zwei Standardabweichungen um den Erwartungswert und 99,7% aller Werte liegen um je drei Standardabweichungen um den Mittelwert.

Beispiel für eine Normalverteilung


Betrachten wir die Normalverteilung und ihre Interpretation anhand eines fiktiven, stark vereinfachten Beispiels. 1.000 Erstklässler einer größeren Stadt nehmen an einem IQ-Test teil.

Intelligenz – sofern die Stichprobe unter denselben Rahmenbedingungen zufällig ausgewählt wurde – ist normalverteilt und IQ-Tests sind ab dem Schulalter sinnvoll einsetzbar. Mit 1.000 Kindern liegt auch eine ausreichend große Stichprobengröße vor.

In folgendem Diagramm sind die Werte des IQ-Tests veranschaulicht. Die x-Achse zeigt die IQ-Werte der Kinder und die Y-Achse, mit welcher Wahrscheinlichkeit diese aufgetreten sind. Zur Vereinfachung haben wir die Werte in 15-er Schritten eingeteilt.

Verteilung IQ Punkte

Interpretieren wir das Diagramm mit dem bereits gesammelten Wissen, ergeben sich folgende Erkenntnisse:

Parameter IQ Beispiel

Fazit


Die Normalverteilung ist die wichtigste und grundlegende Wahrscheinlichkeitsverteilung.

Beachtet man ein paar Rahmenbedingungen wie den zentralen Grenzwert für eine ausreichend große Stichprobengröße und kennt man die Interpretation der verschiedenen Parameter, kann man viele komplexe statistische Probleme mit einer einfachen, allgemeingültigen Verteilung modellieren.





Lektorat Plus für eine perfekte Bachelor- oder Masterarbeit.