Histoire et raisonnement

« statistiquement significatif », qu'est-ce que ça veut dire ? »

Image symbole : Diverses façons de représenter les évaluations statistiques (diagrammes à barres, diagrammes circulaires, avec stylo à bille et calculatrice)

En statistique, des informations quantitatives sont décrites, explorées et analysées. Image : CanStockPhoto

Dans les statistiques, on travaille avec des informations quantitatives. Il est souvent important de déterminer si les observations sont significatives. Cela signifie que l’on essaie de répondre à des questions telles que : Une série d’observations diffère-t-elle clairement d’une autre série ? Les données s’écartent-elles nettement d’une hypothèse précédemment établie ?

Les statistiques comprennent des méthodes utilisées pour décrire, explorer et analyser des informations quantitatives.  On vérifie notamment si les observations concordent avec les réflexions théoriques. Les méthodes statistiques sont utilisées dans de nombreux domaines différents, par exemple en politique, en sciences humaines et naturelles, en médecine et en technologie.

Sous-domaines de la statistique 

Dans la statistique descriptive, les observations ou les données sont décrites et présentées clairement. Cela comprend aussi le calcul de valeurs moyennes. Dans la statistique exploratoire, on veut obtenir des informations sur des données que l’on ne peut voir au premier coup d’œil. Pour cela, les données sont par exemple converties ou subdivisées en groupes. La statistique mathématique en revanche analyse les données et cherche à prouver des théories.

Signification statistique

Carte de la Suisse, colorée dans différentes nuances de rouge pour montrer les zones où l'augmentation de la température est plus forte (surtout le nord-est de la Suisse) et moins importante (Tessin).

Évolution de la température moyenne annuelle en Suisse depuis le début des mesures en 1864 (en °C par décennie). À l’aide des tests statistiques, on peut montrer que la hausse des températures moyennes annuelles est significative et non aléatoire. Mais les statistiques ne fournissent pas d’explication à ce phénomène, d’autres études scientifiques sont nécessaires pour cela. Image : Office fédéral de météorologie et de climatologie MétéoSuisse

La signification statistique est un principe important. À l’aide de tests statistiques, on peut déterminer si des différences (par exemple entre différents groupes, moments ou lieux) sont aléatoires ou significatives. Si elles sont significatives, cela signifie qu'il y a probablement une cause systématique à ces différences. Il existe différents tests de signification selon le type de données concernées. Pour les tests, l'hypothèse initiale est toujours que les différences sont aléatoires. Le résultat du test est ce que l’on appelle la valeur-p. Celle-ci indique la probabilité de se tromper sur le caractère aléatoire des différences. Autrement dit : une valeur-p élevée indique que les données étudiées différent les unes des autres de façon purement aléatoire. Une valeur-p très faible cependant montre que l’on se trompe probablement en attribuant la distribution des données au hasard. La règle est souvent que les différences sont considérées comme « significatives » pour une valeur-p [lt] 0,05. Cela correspond à une probabilité d’erreur inférieure à 5 %.

Les températures en Suisse

Températures moyennes annuelles en Suisse de 1864 à 2016

Températures moyennes annuelles en Suisse de 1864 à 2016. L’évolution lissée est aussi représentée par une ligne de tendance modélisée à l’aide de méthodes statistiques (en rouge). Graphique : Begert & Frei, International Journal of Climatology 2018, CC-Lizenz

On peut prendre l’évolution des températures en Suisse comme exemple : pendant la période 1864-1873, la moyenne des températures moyennes annuelles était de 4,1 °C. Elle était de 4,4°C pour 1964-1973 et de 6,1 °C pour 2010-2019. À l’aide de tests t sur deux échantillons, on peut déterminer si les différences entre les intervalles de dix ans sont significatives. Le test inclut la valeur moyenne, la dispersion des valeurs autour de la valeur moyenne et le nombre de valeurs (ici dans chaque cas).

Le test montre une valeur-p de 0,22 entre les périodes 1864-1873 et 1954-1973. Cette valeur est supérieure à 0,05, il n’y a donc pas de différence statistiquement significative.

Variation des températures annuelles entre 1864 et 2019

Dans ce diagrammes, les températures moyennes annuelles inférieures à la moyenne entre 1961 et 1990 sont marquées en bleu, les températures supérieures à la moyenne en rouge. Une ligne de tendance indique les changements depuis 1864. Image : Office fédéral de météorologie et climatologie Météosuisse

 Les températures plus élevées entre 1964 et 1973 pourraient correspondre à des variations purement aléatoires. Entre 2010 et 2019, les températures sont cependant significativement plus élevées que pour la période 1864-1873, car le test donne une valeur-p de 0,000002 pour ces deux intervalles de temps. Il est donc quasiment exclu que les températures moyennes de 2010-2019 soient aléatoirement plus élevées que pendant l’intervalle de 10 ans considéré au 19e siècle.

En statistique, il existe généralement plusieurs méthodes pour prouver ou rejeter une hypothèse. Dans l’exemple des températures annuelles, on peut aussi vérifier si la hausse continue des températures est significative. De 1864 à 2019, la température moyenne annuelle a augmenté de 0,014 °C par an, soit 1,4 °C en 100 ans. Un test statistique montre, avec une valeur-p [lt] 0,001, que cette hausse est effectivement significative.

L’explication derrière les chiffres

Les tests statistiques permettent de découvrir des différences significatives, mais ils ne peuvent pas nous dire pourquoi ces différences existent. Ainsi, aucune explication de la cause ne peut être déduite de l'augmentation significative des températures. Ce n’est qu’avec des études scientifiques supplémentaires, par exemple sur l’effet de serre, qu’il est possible de comprendre pourquoi les températures augmentent sur Terre. C’est la raison pour laquelle les méthodes statistiques devraient toujours être utilisées avec des considérations théoriques.

Créé: 21.08.2020

Cet article a été automatiquement importé de notre ancien site. Merci de nous signaler, à redaction(at)simplyscience.ch, toute erreur d'affichage.

Plus