© 2019 by Elsevier GmbH

Bitte nutzen Sie das untenstehende Formular um uns Kritik, Fragen oder Anregungen zukommen zu lassen.

Willkommen

Mehr Informationen

B978-3-437-42836-4.00042-4

10.1016/B978-3-437-42836-4.00042-4

978-3-437-42836-4

Abb. 42.1

[L253]

Normalverteilung (Gaußsche Glockenkurve)

Einführung und Statistik

RechnenStatistikStatistikAls Einstieg in die Physik kehren wir thematisch zunächst zum Beginn dieses Buchs zurück und befassen uns mit der Statistik. Erfreulicherweise ist die Statistik, die man im Physikum benötigt, wirklich nicht kompliziert. Die Anforderungen in den Physikpraktika an der eigenen Uni können aber teilweise deutlich darüber hinausgehen – in jedem Fall verhilft euch dieses Kapitel zu einer soliden Basis.

Mittelwerte

Wenn man Daten sammelt, wird man diese irgendwann auch auswerten wollen. Dabei wird i. d. R. nach einem MittelwertMittelwert gesucht, um anzugeben, wie der „durchschnittliche Proband“ im Hinblick auf das untersuchte Merkmal abschneidet. Es gibt allerdings mehrere Möglichkeiten, einen Mittelwert zu berechnen. Ihr solltet euch dabei einprägen, wie die einzelnen Werte definiert sind. Im Studium befasst man sich dann noch intensiver damit, wann welcher Mittelwert sinnvoll ist.

Arithmetisches Mittel

arithmetisches MittelMit dem arithmetischen Mittel hattet ihr in der Schule wahrscheinlich am meisten zu tun. Um es zu berechnen, addiert ihr zunächst alle gemessenen Werte und teilt die Summe durch die Anzahl der Werte:
Pascal, Bernd und Karl sind 1,60 m, 1,75 m und 1,80 groß. Wir rechnen folglich:
In diesem Beispiel ist das arithmetische Mittel also 1,72 m. Häufig verwendet man für das arithmetische Mittel auch den Begriff DurchschnittDurchschnitt.

Median

MedianUm den Median eines Datensatzes zu finden, ordnet man alle Werte zunächst aufsteigend. Dann sucht man sich den Wert in der Mitte, und schon hat man den Median. Und wenn man eine gerade Anzahl an Werten hat, es also keinen Wert in der Mitte gibt? Dann bildet man das arithmetische Mittel der beiden mittleren Werte:
In unserem Beispiel mit Pascal, Bernd und Karl liegt der Median bei 1,75. Wann macht es Sinn, den Median zu verwenden? Angenommen, in einer Klasse sind 20 Schüler und man möchte wissen, wie viel Taschengeld ein „typischer Schüler“ bekommt. 19 Schüler erhalten 30 Euro pro Monat, aber einer bekommt, aus welchem Grund auch immer, 500 Euro. Würde man hier das arithmetische Mittel berechnen, käme man auf 53,50 Euro. Dadurch, dass ein Wert so stark abweicht, erhalten wir als arithmetisches Mittel einen Wert, der fast doppelt so hoch ist, wie das tatsächliche Taschengeld von 95 % der Schüler. Würden wir allerdings alle Schüler der Reihe nach ordnen und nach dem Median suchen, kämen wir auf 30 Euro und kämen damit dem „typischen Schüler“ wesentlich näher. Ob arithmetisches Mittel oder Median sinnvoller sind, hängt folglich immer auch von der Fragestellung ab.

Modalwert

ModalwertDer Modalwert ist schnell gefunden: Wir suchen uns den häufigsten Wert aus unserem Datensatz. Für Pascal, Bernd und Karl wird das schwierig, denn jeder Wert kommt einmal vor. Für unsere Schulklasse wäre der Modalwert (der auch als Modus bezeichnet wird) 30.

Normalverteilung, Glockenkurve und Standardabweichung

NormalverteilungStandardabweichungWir befassen uns weiter mit dem Merkmal Körpergröße, aber vermessen diesmal nicht nur Pascal, Bernd und Karl, sondern gleich 10 000 Leute. Und weil kein Platz ist, um die Tabelle mit allen Werten hier abzudrucken, tragen wir sie einfach in ein Diagramm ein.

Gaußsche Glockenkurve

Gaußsche GlockenkurveAuf die x-Achse kommen dabei die verschiedenen Körpergrößen (also z. B. 1,70 m) und auf der y-Achse tragen wir ein, wie viele Leute mit der jeweiligen Körpergröße sich unter unseren 10 000 Personen fanden. Verbinden wir die Punkte, ergibt sich eine Kurve, die Gaußsche Glockenkurve (Abb. 42.1).
Ihr seht: Die Kurve hat in der Mitte ein Maximum, das die Fläche unter der Kurve in zwei gleich große Hälften teilt. Entfernt man sich vom Mittelpunkt, streben die Werte erst schnell, dann immer langsamer, gegen 0. Man spricht von einer Normalverteilung. Das Maximum würde für Männer in Deutschland bei ca. 1,80 m liegen. Das Ganze ist eigentlich relativ intuitiv: Wenn ihr euch fragt, wie viele Leute in eurem Freundeskreis zwischen 1,70 m und 1,90 m groß sind, fallen euch wahrscheinlich relativ viele ein. Zwischen 1,60 m und 1,70 m bzw. 1,90 m und 2 m werden es schon merklich weniger und unter 1,60 m bzw. ab 2 m kommen den meisten nur noch vereinzelt Personen in den Sinn.
Man spricht beim Maximum auch vom Erwartungswert, denn wählt man aus unseren 10 000 Personen eine aus, so ist die Wahrscheinlichkeit am höchsten, dass ihre Körpergröße dem Erwartungswert entspricht.

Standardabweichung

StandardabweichungEs gibt viele Merkmale, die normalverteilt sind. Bei einigen standardisierten Tests (IQ-Tests) finden sich z. B. viele Probanden mit mittleren Ergebnissen, während die Ausreißer nach oben und unten immer seltener werden.
All diese Merkmale stellen sich als Glockenkurve dar, was aber nicht heißt, dass diese Kurve immer exakt gleich aussieht. Bei Kurve A ist das Maximum vielleicht höher als bei Kurve B, wohingegen bei Kurve B die Breite der Kurve größer ist, die Werte also teilweise stärker vom Maximum abweichen.
Besonders die Breite der Kurve ist für uns von großem Interesse und der wichtigste Weg, diese anzugeben, ist mittels der Standardabweichung (σ).
Die mathematischen Herleitung der Standardabweichung können wir uns guten Gewissens schenken.

Merkt euch aber, weil es gelegentlich mal gefragt wird: Die Standardabweichung ist die Quadratwurzel der Varianz!

Wenn man nun für eine Normalverteilung die Standardabweichung kennt, kann man damit ziemlich gut arbeiten, denn für jede Normalverteilung gilt:
  • Wenn man vom Mittelwert eine Standardabweichung nach links und nach rechts geht, finden sich in diesem Intervall (± 1σ bzw. 1-σ-Intervall) rund 68 % aller Werte.

  • Wenn man vom Mittelwert zwei Standardabweichung nach links und nach rechts geht, finden sich in diesem Intervall (± 2σ bzw. 2-σ-Intervall) rund 95 % aller Werte.

  • Wenn man vom Mittelwert drei Standardabweichung nach links und nach rechts geht, finden sich in diesem Intervall (± 3σ bzw. 3-σ-Intervall) über 99 % aller Werte.

Damit das Ganze etwas anschaulicher wird:
Angenommen, für unsere Körpergrößennormalverteilung mit Mittelwert 1,80 m wäre die Standardabweichung σ =10 cm. Dann würden sich im ± 1σ-Intervall (also von 1,70–1,90 m) folglich 68 % unserer Probanden, also 6 800 Personen finden. Im ± 2σ-Intervall (also von 1,60–2,00 m) lägen schon 95 % aller Werte etc.
Und zwischen 1,80 m und 1,90 m? Hierbei handelt es sich um ein halbes ± 1σ-Intervall (nämlich nur „+1σ“), sodass die Größe von 34 % der Probanden in dieses Intervall fallen sollten.
Übrigens: Wenn man sagt, dass 68 % der Personen unserer Untersuchung zwischen 1,70 m und 1,90 m groß sind, gibt man die relative Häufigkeit an. Die zugehörige absolute Häufigkeit erhält man, indem man mit dem Stichprobenumfang (also 10 000) multipliziert:
10 000 × 0 , 68 = 6 800

Messfehler

Wenn wir für unsere Untersuchung die Körpergröße von 10 000 Personen messen, werden Fehler passieren und das ist ganz normal. Denn selbst das präziseste Instrument arbeitet nicht mit hundertprozentiger Genauigkeit.
Auch bei den Messfehlern unterscheidet man absolute von relativen MessfehlernMessfehler. Angenommen, unser absoluter Messfehler beträgt ± 1 cm (z. B. weil wir das Maßband nicht immer genau gleich gespannt haben), dann liegt der relative Fehler für einen Messwert von 1,80 m bei:
0 , 01 m : 1 , 80 m 0 , 56 %
Wie könnte man diesen Fehler reduzieren? Zum Beispiel, indem man mehrere Messungen durchführt und den Mittelwert berechnet.
Bei unserer Körpergrößenuntersuchung muss man sich auch die Frage stellen, wie wahrscheinlich es ist, dass der Mittelwert von 1,80 m tatsächlich der Durchschnittsgröße der Bevölkerung entspricht. Eine Antwort darauf gibt der Standardfehler des Mittelwerts. Um ihn zu berechnen, teilt man die Standardabweichung unserer Normalverteilung durch die Wurzel des Stichprobenumfangs n:
Es sollte klar sein, dass bei einer weniger breiten Kurve (kleines σ) die Wahrscheinlichkeit groß ist, den Mittelwert präzise bestimmt zu haben. Umgekehrt kann man die Aussagekraft des Mittelwerts aber auch erhöhen, indem man den Umfang der Stichprobe von 10 000 auf z. B. 20 000 Personen erhöht (großes n).

Zusammenfassung

  • Modalwert, Median und arithmetisches Mittel sind drei mögliche Mittelwerte. Wann man welchen verwendet, hängt von den auszuwertenden Daten und der Fragestellung ab.

  • Die Normalverteilung wird euch im Studium oft begegnen, sodass ihr Begriffe wie Standardabweichung und relative Häufigkeit sicher beherrschen solltet.

  • Um den Messfehler zu reduzieren, kann es hilfreich sein, Messungen zu wiederholen.

Holen Sie sich die neue Medizinwelten-App!

Schließen