Statistische Analphabeten

Krebs, Corona, Kaffee: Wie uns Statistiken in die Irre führen!

Panikmache und falsche Sicherheiten sind oft Ergebnis falsch interpretierter Daten. Die Autoren der „Unstatistik des Monats“ befassen sich in einem Buch damit.

Es mag sein, dass Kaffeetrinker länger leben. Aber in echten Experimenten nachweisen lässt sich das nicht.
Es mag sein, dass Kaffeetrinker länger leben. Aber in echten Experimenten nachweisen lässt sich das nicht.imago/Panthermedia

„Kaffeetrinker leben länger!“, „300.000 vorzeitige Todesfälle durch Feinstaubbelastung“, „Berliner werden immer unglücklicher“, „Wurst und Schinken als krebserregend eingestuft!“, „Smartphones machen denkfaul“ – nahezu täglich erreichen einen Meldungen, die angeblich auf überzeugenden Studienergebnissen beruhen. Mitunter produziert man auch als Wissenschaftsjournalist selbst so etwas.

Doch spätestens die Corona-Pandemie hat gezeigt, dass man mit Studien alles Mögliche belegen kann. Wissenschaftliche Erkenntnisse verändern sich. Bei Corona wandelten sich über die Monate die Aussagen: etwa zum Nutzen, eine Maske zu tragen, zu Inzidenzen und Sterblichkeit – je nachdem, wie die Datenlage überhaupt war, wie Daten ausgewählt und interpretiert wurden. 

Auch Experimente können unterschiedliche Ergebnisse bringen. Das hängt unter anderem von der Auswahl der Personengruppen ab und den Bedingungen, unter denen die Studie stattfindet. Und auch Ergebnisse von Umfragen können sich deutlich unterscheiden – je nachdem, wer gefragt wird, wie gefragt wird und wie die Antworten interpretiert werden.

Eine Art Analphabetismus im Umgang mit Zahlen und Risiken

Bei Statistiken kann man zu den verblüffendsten Aussagen kommen. Zum Beispiel: „Grüne fahren SUV und Joggen macht unsterblich“. So lautet der Titel eines neuen Buchs mehrerer Autoren, die seit gut zehn Jahren regelmäßig die „Unstatistik des Monats“ herausgeben und damit zeigen wollen, dass in Gesellschaft und Medien „eine Art Analphabetismus im Umgang mit Zahlen, mit Wahrscheinlichkeiten und Risiken herrscht“, wie es in der Ankündigung heißt.

Zum Autorenteam gehören der Berliner Psychologe Gerd Gigerenzer, der Bochumer Ökonom Thomas Bauer, der Dortmunder Statistiker Walter Krämer und die Münchener Datenanalyse-Expertin Katharina Schüller. Menschen fielen allzu schnell „auf Fake News und Panikmache rein“, schreiben sie. Viele suchten auch absolute Sicherheiten, wo es keine gebe.

„Das korrekte Interpretieren von Zahlen und Statistiken ist im Land der Dichter und Denker noch immer kein Teil der Allgemeinbildung“, heißt es im Vorwort. „Viele scheinen sogar stolz darauf zu sein, damit nur schlecht zurechtzukommen.“ Es herrsche ein allgemeiner Mangel an statistischem Denken.

Verzerrte Aussagen durch falsche Interpretation von Studien

Hier zwei Beispiele für falsche Interpretationen, die dem Buch seinen Titel gaben. Erstens: „Grünen-Wähler fahren gern SUV“. Diese Aussage wird bei manchem eine hämische Reaktion auslösen nach dem Motto: „Hab ich mir doch gleich gedacht: Grüne sind Heuchler und fahren selbst Geländewagen.“ Grundlage ist eine falsch interpretierte Befragung unter 1042 Wählern verschiedener Parteien.

Diese Befragung zum Thema Auto ergab im Jahre 2021, dass sich Wähler von Bündnis 90/Die Grünen mit 16,3 Prozent am häufigsten einen SUV angeschafft haben oder anschaffen wollen, gefolgt von Wählern der SPD (16 Prozent), der AfD (15,9 Prozent), der Unionsparteien (15,6 Prozent), der FDP (13,4 Prozent) und der Linken (7,7 Prozent).

Jeder sechste Grünen-Sympathisant habe laut Studie „einen Geländewagen vor der Tür stehen“, schrieb daraufhin eine große Zeitung. Sie hatte nicht beachtet, dass – wie die Buchautoren schreiben – nur Personen befragt worden seien, „die in den nächsten sechs Monaten die Anschaffung eines Autos planen oder in den vergangenen 12 Monaten ein Auto gekauft haben“. Alle anderen Personen hätten an der Befragung nicht teilgenommen. Gar nicht erst erfasst worden seien also all jene Grünen, die gar kein Auto haben, keine Anschaffung planen und dafür Fahrrad oder „Öffis“ fahren. Damit sei die Aussage völlig verzerrt.

Medien-Schlagzeilen werden durch die Studien selbst oft nicht gedeckt

Zweites Beispiel: „Joggen macht unsterblich“. So bringen die Buchautoren Schlagzeilen zu einer US-amerikanischen Studie von 2017 auf den Punkt. In ihr wurden etwa 55.000 Frauen und Männer im Alter von 18 bis 100 Jahren untersucht, um herauszufinden, ob Joggen das Leben verlängert. Das Ergebnis war, dass das Laufen mit einer Verringerung von Herzkrankheiten, Krebs und anderen Krankheiten einhergeht. Die Teilnehmer joggten im Schnitt zwei Stunden pro Woche. Die statistische Auswertung ergab, dass sich ihr  Leben pro Stunde Joggen um etwa sieben Stunden verlängert – gegenüber Menschen, die nicht laufen. 

Im Internet erschienen dazu Schlagzeilen wie: „Jede Stunde Joggen schenkt dir sieben Stunden Lebenszeit!“ Das erweckte irrtümlich den Eindruck, dass jemand, der zum Beispiel täglich vier Stunden joggt, pro Tag einen Gewinn von 28 Stunden an Lebenszeit herauslaufen könne. Sozusagen in Richtung Unsterblichkeit, weil sich das ja immer mehr summieren würde.

Dabei bezog sich das Ergebnis der Studie nur auf die etwa zwei Stunden Laufen pro Woche. Die maximale Verlängerung der Lebenszeit durch Joggen werde auf knapp drei Jahre geschätzt, schreiben die Autoren. Exzessives Jogging könne sogar das Risiko erhöhen, frühzeitig an Herzkrankheiten zu sterben. Ihr Fazit: „Schlagzeilen über wissenschaftliche Studien wecken oft Erwartungen, die durch die Studie selbst überhaupt nicht gedeckt sind.“

Korrelationen sind nicht unbedingt Kausalitäten

Einige Grundaussagen des Buchs sollte sich jeder merken, der mit Statistiken zu tun hat oder gerne welche liest. Die wohl wichtigste lautet: „Korrelationen sind nicht unbedingt Kausalitäten.“ Ob man zum Beispiel länger lebt, weil man regelmäßig Kaffee trinkt, ist schwer zu beweisen. Zwar gibt es Publikationen – wie etwa eine US-Studie mit Daten von fast 500.000 Menschen – die zeigen, dass Kaffeetrinker weniger häufig an Herz-Kreislauf-Krankheiten und Krebs sterben als Nicht-Kaffeetrinker.

Aber dies sei lediglich eine Korrelation, schreiben die Buchautoren – gekennzeichnet durch zwei Variablen, „die systematisch in die gleiche Richtung laufen“. Die Schlagzeile „Kaffee verlängert das Leben“ behaupte jedoch eine Kausalität, die nicht bewiesen sei. Vielleicht beeinflusse ja ein dritter Faktor den Zusammenhang. „Menschen, die beispielsweise aktiv im Leben stehen und deshalb länger leben, trinken auch gerne Kaffee.“

Für den Nachweis einer Kausalität brauche man „ein randomisiertes Experiment“, schreiben die Autoren, was praktisch nicht umsetzbar sei. Denn man müsste Tausende Menschen – per Zufall ausgelost – mehreren Gruppen zuordnen. Die eine Gruppe dürfte für Jahrzehnte gar keinen Kaffee trinken. Die andere müsste eine Tasse pro Tag trinken, die nächste zwei bis drei Tassen und so weiter.

Weil so etwas in der Praxis nicht umsetzbar sei, gebe es nur „retrospektive Studien“, bei denen Daten aus der Vergangenheit ausgewertet werden, „prospektive Studien“, bei denen Daten ab Beginn einer Studie gesammelt werden, oder einfach nur „Beobachtungsstudien“.

Scheinkorrelation: Mit der Schuhgröße wächst auch die Intelligenz

Die Autoren nennen eine Reihe von Beispielen für „Scheinkorrelationen“ oder „Nonsenskorrelationen“, bei denen zwei Variablen erkennbar zusammenhängen. Zum Beispiel wächst mit der Schuhgröße bei Jugendlichen auch deren Intelligenz. Aber hier wirken die Füße nicht aufs Gehirn – sondern beide hängen mit dem Anstieg des Lebensalters zusammen, also der generellen Entwicklung. Genau wie es beim Zusammenhang von steigendem Nettoeinkommen und häufigeren Krankenhausbesuchen der Fall ist.

Nahezu legendär sind Studien, denen zufolge es eine statistisch signifikante Korrelation zwischen Storchenpopulationen und menschlichen Geburtenraten in ganz Europa gebe. Sie werden gerne scherzhaft zum Beweis dafür herangezogen, dass „Babys von Störchen gebracht“ werden. 

Studien dienten nicht selten auch der „Angstmache“, schreiben die Buchautoren. Sie nennen als Beispiele „die republikweite Dioxin-Panik im Winter 2011“, die sich am Ende als Fehlalarm herausstellte, dazu panikmachende Studien über die Todesgefahr von Feinstaub und Stickstoff sowie über das Krebsrisiko – „der moderne Angstmacher par excellence“.

So hätten zum Beispiel Meldungen von 2015 in Deutschland „zu einer wahren Wursthysterie“ geführt. Eine Studie hatte nämlich ergeben, dass Menschen, die täglich 50 Gramm Wurst verzehrten, ein um 18 Prozent erhöhtes Risiko für Darmkrebs hätten. Die Wurst als neuer Asbest!

Krebsgefahr beim Wurstessen: von absolutem und relativem Risiko

Solche Risikoangaben würden oft falsch interpretiert, schreiben die Autoren. In diesem Fall in die Richtung, dass von 100 Wurstessern 18 Krebs bekämen. Ähnlich dachten dem Buch zufolge auch Ärzte in den USA, als man ihnen eine ähnliche Aussage vorlegte: „Bei Personen, die regelmäßig Passivrauchern ausgesetzt sind, steigt das Risiko einer Herzkrankheit um 25 Prozent. Das heißt, von je 4 Nichtrauchern, die in einer verräucherten Umgebung wie einer Kneipe arbeiten, bekommt einer wegen Passivrauchens eine Herzkrankheit.“ Ein Drittel der Ärzte stimmte der Aussage zu.

Sie hatten etwas ganz Entscheidendes nicht beachtet, was die Buchautoren ein Grundprinzip statistischen Denkens nennen: „Relative Risiken sind nicht absolute Risiken.“ Sie veranschaulichen es am Beispiel der Herzkrankheit: Man nehme an, von 100 Personen, die nicht dem Passivrauchen ausgesetzt seien, bekämen 8 irgendwann eine Herzkrankheit (dies werde Grundrate genannt). Dann steige bei intensiven Passivrauchern dieser Anteil um 25 Prozent – also von 8 auf 10. Das wäre dann etwa jeder Zehnte.

Beim Beispiel mit der wurstigen Krebsgefahr beträgt das allgemeine Risiko, irgendwann einmal an Darmkrebs zu erkranken, etwa 5 Prozent (Grundrate!). Bei konsequenten Wurstessern steigt es um 18 Prozent: auf 5,9 Prozent. Aber die Buchautoren vermuten, dass auch die Ausgangsprozente in diesem Beispiel schon falsch seien. Denn das Wurstessverhalten der Erkrankten sei zum Beispiel durch retrospektive Befragungen ermittelt worden, nicht durch eine randomisierte Studie. So wie beim Kaffee.

Mangelnde Risikokompetenz führt zu Verwirrung und Fake News

„Die Grundrate im Auge behalten“ – so lautet also für die Autoren ein weiteres Grundprinzip statistischen Denkens. Wo dies nicht passiert, können statistische Vergleiche voll nach hinten losgehen. Als Beispiel nennen die Autoren eine ZDF-Talkshow mit Markus Lanz vom 10. November 2021. Dort wurde eine Grafik präsentiert, die den Eindruck erweckte, dass die Corona-Impfung nahezu unwirksam sei.

In der Grafik setzte man Zahlen zu Infektionen, Intensivbehandlung und Todesfällen bei Nicht-Geimpften und Geimpften ab 60 Jahren miteinander in Beziehung. „Mir geht’s kalt den Rücken runter“, sagte Lanz, weil diese relativ ähnlich waren. Unter den verstorbenen Infizierten gab es zum Beispiel ein Verhältnis von etwa 40 Prozent Geimpften zu etwa 60 Prozent Nicht-Geimpften. Verhinderte also die Impfung nur wenige Todesfälle?

Nicht beachtet wurde dabei ein großes Gefälle: Unter 1000 Menschen ab 60 Jahren gab es damals 910 Geimpfte und 90 Nicht-Geimpfte. Das Verhältnis 40 zu 60 wiederum bezog sich allein auf die Todesrate. Wenn insgesamt 10 von 1000 Menschen mit Covid-19 stürben, seien von diesen etwa 4 geimpft und 6 nicht geimpft, so die Autoren. Und sie erklären die wirkliche Aussage der Grafik: „Das heißt, 4 von den 910 Geimpften und 6 von den 90 Nicht-Geimpften sterben mit Covid-19, also weniger als 0,5 Prozent der Geimpften, aber mehr als 6 Prozent der Nicht-Geimpften.“ Im Ergebnis zeigte sich also ein klarer Nutzen der Impfung. 

Den Glauben an absolute Sicherheit aufgeben

„Mangelnde Risikokompetenz ist einer der Gründe dafür, dass über den Nutzen der Impfung Verwirrung herrscht und bizarre Verschwörungstheorien entstehen“, schreiben die Autoren. Das betrifft auch die Impfnebenwirkungen im Vergleich zu den Risiken durch Covid-19 und anderes.

Immer müsse man in der Statistik fragen: „Prozent wovon?“, so die Autoren. Der mangelnden Risikokompetenz tritt unter anderem das Internetportal des Harding-Zentrums für Risikokompetenz an der Universität Potsdam entgegen (hardingcenter.de). Es befasst sich mit Fragen wie: „Welche Risiken birgt die elektronische Patientenakte, eine Diagnose durch künstliche Intelligenz und von Gesundheits-Apps? Inwieweit kann die Teilnahme an Krebsfrüherkennungs-Programmen einen Krebstod verhindern?“

„Sicherheit ist eine Illusion“ – so lautet für die Autoren eines der Grundprinzipien des statistischen Denkens. „Statistisches Denken ist die Kunst, Risiken zu verstehen“, schreiben sie. Man müsse „den Glauben an absolute Sicherheiten aufgeben und lernen, mit Ungewissheit zu leben“. Auch gehe es darum, „ein Lebensgefühl zu entwickeln, das sich an Fakten und Evidenz orientiert, zusammen mit einer gesunden Portion Skepsis gegenüber festen Überzeugungen und Behauptungen aller Art“.

Bauer, Gigerenzer, Krämer, Schüller: „Grüne fahren SUV und Joggen macht unsterblich. Über Risiken und Nebenwirkungen der Unstatistik“. Campus-Verlag, Frankfurt am Main/New York 2022, 208 Seiten, 22 Euro.