Schokolade, Nobelpreise und Fehlschlüsse – Irrende Algorithmen

Intelligente Algorithmen können aus unterschiedlichen Datensätzen wertvolle Erkenntnisse herausfiltern. So etwa, warum es in der Schweiz so viele Nobelpreisträger gibt. Die Ursache dafür ist erstaunlicherweise darin zu suchen, dass in der Schweiz der Schokoladenkonsum pro Kopf höher ist als anderswo. Das zumindest scheint die Abbildung unten zu belegen. Oder stimmt das vielleicht gar nicht?

Nehmen wir ein anderes Beispiel: In der Schweiz sind seit dem Zweiten Weltkrieg sowohl die Anzahl Störche wie auch die Anzahl Babys pro Familie zurückgegangen. Beweist das, dass es eben doch die Störche sind, die die Babys bringen – so wie man früher glaubte? Nein, das tut es nicht. Dass heute weniger Störche auf unseren Dächern klappern ist zwar traurig. Aber es ist nicht die Ursache dafür, dass weniger Kinder geboren werden.

Der Harvard-Student Tyler Vigen hat eine ganze Serie von solchen kuriosen Scheinkorrelationen aufgespürt. Viele davon sind zum totlachen. Aber sie belegen auch ein Problem, das Statistiker gut kennen. Es lautet: "Korrelation ist nicht Kausalität". Der Zusammenhang zwischen zwei Dingen heisst noch lange nicht, dass das eine das andere bewirkt.

Es gibt in der Informatik einen hübschen Merksatz: "Garbage in, garbage out" Auf Deutsch heisst das so viel wie: "Mist rein, Mist raus". Auf Big Data bezogen bedeutet es: Wie aussagekräftig das Resultat ist, das ein Algorithmus liefert, kommt nicht nur auf die Daten an, mit denen er gefüttert wird. Sondern auch darauf, ob er so programmiert ist, dass er die richtigen Parameter berechnet.

Quelle: Technoscope 1/20: Big Data. Technoscope ist das Technikmagazin der SATW für Jugendliche

Durchschnittliche Bewertung:
  •  
(0 Bewertungen)

Was sagst Du dazu?

Dieser Artikel hat noch keine Kommentare erhalten.