Technik & Materialien

Was bedeutet eigentlich „statistisch signifikant“?

Symbolbild: Verschiedene Darstellungsmöglichkeiten für statistische Auswertungen (Balkendiagramme, Kreisdiagramme, mit Kugelschreiber und Rechner)

In der Statistik werden quantitative Informationen beschrieben, erkundet und analysiert. Bild: CanStockPhoto

In der Statistik wird mit quantitativen Informationen gearbeitet. Dabei ist es oft wichtig herauszufinden, ob Beobachtungen signifikant sind. Das heisst, man versucht Fragen zu beantworten wie: Unterscheidet sich eine Serie von Beobachtungen klar von einer anderen? Weichen die Daten eindeutig von einer vorher festgelegten Annahme ab?

Die Statistik umfasst Methoden, mit denen quantitative Informationen beschrieben, erkundet und analysiert werden. Dabei wird unter anderem getestet, ob Beobachtungen mit theoretischen Überlegungen zusammenpassen. Statistische Methoden werden in vielen verschiedenen Bereichen angewendet, zum Beispiel in der Politik, in Geistes- und Naturwissenschaften, Medizin und Technik.

Teilgebiete der Statistik

In der deskriptiven Statistik werden Beobachtungen bzw. Daten beschrieben und übersichtlich dargestellt. Dazu gehört auch die Berechnung von Mittelwerten. In der explorativen Statistik will man Informationen über Daten erhalten, die man auf den ersten Blick nicht sieht. Dazu werden zum Beispiel Daten umgewandelt oder in Gruppen aufgeteilt. Die mathematische Statistik dagegen analysiert Daten und man versucht, Theorien zu beweisen.

Karte der Schweiz, eingefärbt in verschiedenen Rottönen zur Darstellung von Gebieten mit stärkerer Temperaturzunahme (insbesondere Nordostschweiz) und weniger deutlicher Temperaturzunahme (Tessin)

Veränderung der Jahresmitteltemperatur in der Schweiz seit Messbeginn im Jahr 1864 (in °C pro 10 Jahre). Mit statistischen Tests kann gezeigt werden, dass der Anstieg der Jahresmitteltemperaturen signifikant und nicht zufällig ist. Eine Erklärung dafür liefert die Statistik aber nicht, dafür sind andere wissenschaftliche Studien (wie über den Treibhauseffekt) notwendig. Bild: Bundesamt für Meteorologie und Klimatologie MeteoSchweiz

Statistische Signifikanz

Ein wichtiges Prinzip ist die statistische Signifikanz. Mit statistischen Tests kann man herausfinden, ob Unterschiede (zum Beispiel zwischen verschiedenen Gruppen, Zeitpunkten oder Orten) zufällig oder signifikant sind. Wenn sie signifikant sind, bedeutet dies, dass es wahrscheinlich eine systematische Ursache für die Unterschiede gibt. Je nachdem, um was für Daten es sich handelt, gibt es verschiedene Signifikanz-Tests. Für die Tests geht man zu Beginn immer davon aus, dass die Unterschiede zufällig sind. Als Ergebnis des Tests erhält man den sogenannten p-Wert. Dieser gibt die Wahrscheinlichkeit an, sich darin zu irren, dass die Unterschiede zufällig sind. Anders gesagt: Ein grösserer p-Wert spricht dafür, dass die untersuchten Daten sich rein zufällig voneinander unterscheiden. Ein sehr kleiner p-Wert jedoch zeigt an, dass man sich sehr wahrscheinlich irrt, wenn man die Datenverteilung auf den Zufall schiebt. Oft legt man fest, dass bei einem p-Wert [lt] 0.05 die Unterschiede als „signifikant“ gelten. Dies entspricht einer Irrtumswahrscheinlichkeit von weniger als 5%.

Grafik der Jahresmitteltemperaturen in der Schweiz von 1864–2016 mit Trendlinie, welche den statistisch signifikanten Anstieg der Temperaturen zeigt

Jahresmitteltemperaturen in der Schweiz von 1864–2016. Dargestellt ist auch der geglättete Verlauf anhand einer mit statistischen Methoden modellierten Trendlinie (rot). Grafik: Begert & Frei, International Journal of Climatology 2018, CC-Lizenz

Die Temperaturen in der Schweiz

Ein Beispiel ist die Entwicklung der Temperaturen in der Schweiz: Im Zeitraum 1864–1873 war der Mittelwert der Jahresdurchschnittstemperaturen 4.1 °C. Von 1964–1973 war er 4.4 °C, und von 2010–2019 war er 6.1 °C. Mithilfe eines sogenannten Zweistichproben-t-Tests kann man herausfinden, ob die Unterschiede zwischen den 10-Jahres-Intervallen signifikant sind. Bei dem Test wird sowohl der Mittelwert, die Streuung der Werte um den Mittelwert und die Anzahl der Werte (hier jeweils 10) miteinbezogen.

Der Test zeigt zwischen den Zeiträumen 1864–1873 und 1964–1973 einen p-Wert von 0.22. Dieser Wert ist grösser als 0.05, es gibt also keinen statistisch signifikanten Unterschied. Die höheren Temperaturen 1964–1973 könnten rein zufälligen Schwankungen entsprechen. Zwischen 2010 und 2019 waren die Temperaturen aber signifikant höher als 1864–1873, denn der Test ergibt für diese beiden Zeitintervalle einen p-Wert von 0.000002. Es ist daher so gut wie ausgeschlossen, dass die mittleren Temperaturen von 2010–2019 zufällig höher ausfielen als in dem betrachteten 10-Jahres-Intervall im 19. Jahrhundert.

Balkendarstellung der Jahresmitteltemperaturen - blau eingefärbt die Jahre unter dem Durchschnitt von 1961–1990, rot diejenigen über dem Durchschnitt. Ab ca. 1990 liegt jedes Jahr über diesem Durchschnitt, die Trendlinie von 1864 bis heute steigt klar an.

In diesem Balkendiagramm sind Jahresmitteltemperaturen unter dem Durchschnitt von 1961–1990 blau markiert, solche über dem Durchschnitt rot. Eine Trendlinie zeigt die Veränderung seit 1864 an. Bild: Bundesamt für Meteorologie und Klimatologie MeteoSchweiz

In der Statistik gibt es meist mehrere Methoden, um eine Hypothese zu belegen oder zu verwerfen. Beim Beispiel der Jahrestemperaturen lässt sich auch testen, ob die kontinuierliche Steigung der Temperaturen signifikant ist. Von 1864 bis 2019 stieg die mittlere Jahrestemperatur um 0.014 °C pro Jahr, das sind 1.4 °C in 100 Jahren. Ein statistischer Test zeigt mit einem p-Wert [lt] 0.001, dass dieser Anstieg tatsächlich signifikant ist.

Die Erklärung hinter den Zahlen

Statistische Tests können zwar signifikante Unterschiede herausfinden, sie können aber nichts darüber aussagen, warum diese Unterschiede bestehen. So lässt sich aus den signifikant gestiegenen Temperaturen keine Erklärung für die Ursache herauslesen. Erst mit zusätzlichen wissenschaftlichen Studien, z. B. über den Treibhauseffekt, ist es möglich zu verstehen, warum die Temperaturen auf der Erde steigen. Daher sollten statistische Methoden immer nur zusammen mit theoretischen Überlegungen angewendet werden.

Erstellt: 21.08.2020
Mehr