Wahlzeiten sind Hochsaison für die grafische Darstellung von quantitativen Daten. Selten sind Medien dermaßen voll mit Diagrammen, die uns veranschaulichen wollen, wer warum wo wie viel Zustimmung bekommen hat.

Neben der üblichen Auswertung von Wahltagsbefragungen (also Individualdaten) werden in jüngerer Zeit Darstellungen anhand von Aggregatdaten üblich. Zumeist handelt es sich dabei um Zusammenhänge zwischen Wahlergebnissen und ökonomischen oder demografischen Merkmalen bestimmter regionaler Einheiten (etwa von Gemeinden, Wahlkreisen oder US-Bundesstaaten).

Was die Kaufkraft mit Van der Bellen zu tun hat

So findet man etwa starke Korrelationen zwischen Kaufkraft und Van-der-Bellen-Anteil auf Gemeindeebene, zwischen Brexit-Zustimmung und EU-Exportabhängigkeit in den Regionen Großbritanniens oder zwischen Bevölkerungsdichte und Trump-Stimmenanteil in den US-Countys.

All das ist gut und schön. Mehr Daten sind in der Regel besser als weniger. Und tatsächlich haben Aggregatdaten einen großen Vorteil: Sie sind für gewöhnlich mit deutlicher weniger Unsicherheit behaftet als Umfragen.

Bild nicht mehr verfügbar.

Alexander Van der Bellen war stärker in Gemeinden mit hoher Kaufkraft. Aber was lässt sich daraus ableiten?
Foto: AP

Ökologischer Fehlschluss

Dennoch lauert hier eine Gefahr: Selbst bei vorsichtiger Interpretation entsteht für die Leser oft der Eindruck, man könne die Zusammenhänge zwischen Merkmalen von regionalen Einheiten einfach auf die Individualebene übertragen: Van der Bellen war stärker in Gemeinden mit mehr Kaufkraft? Das muss wohl bedeuten, dass wohlhabendere Menschen eher Van der Bellen gewählt haben!

Bei dieser Art von Schlussfolgerung handelt es sich um einen ökologischen Fehlschluss. Nur weil die Charakteristika von Aggregateinheiten (etwa Kaufkraft und Van-der-Bellen-Wahl bei Gemeinden) korrelieren, heißt das noch lange nicht, dass dieser Zusammenhang jedenfalls auch auf Individualebene vorliegt (Menschen mit höherem Einkommen wählten eher Van der Bellen).

Ein Beispiel zur Veranschaulichung: der Zusammenhang zwischen Bildungsgrad und Wahlbeteiligung bei der Nationalratswahl 2013. Das Streudiagramm unten zeigt, wie der Anteil der Personen mit Hochschulbildung in den politischen Bezirken (ohne Wien) mit der Wahlbeteiligung korrespondiert. Wie die Regressionsgerade andeutet, gibt es einen moderat negativen Zusammenhang (Korrelationskoeffizient: -0,26). Bezirke mit höherem Akademikeranteil haben also im Schnitt eine niedrigere Wahlbeteiligung.

Wenn wir aber auf die Individualebene wechseln (mit Autnes-Befragungsdaten), dann sehen wir den gegenteiligen Zusammenhang: Personen mit höherer formaler Bildung gehen eher zur Wahl als solche mit niedriger.

Warum die zwei Zusammenhänge in unterschiedliche Richtungen weisen? Der entscheidende Faktor sind Stadt-Land-Unterschiede. Höher gebildete Menschen leben häufiger in Städten, wo die Wahlbeteiligung tendenziell niedriger ist. Was also in der ersten Grafik sichtbar wird, sind demnach eher Urbanitäts- als Bildungseffekte.

Ein bekanntes Beispiel für potenziell irreführende Korrelationen auf der Aggregatebene ist der Zusammenhang zwischen Einkommen und Wahlverhalten in den USA: Obwohl reichere Personen für gewöhnlich eher die Republikaner unterstützen (2016 war hier eine Ausnahme), dominieren die Demokraten in den wohlhabenderen Staaten.

Natürlich gibt es viele Fälle, wo die Zusammenhänge auf der Individual- und der Aggregatebene in die gleiche Richtung deuten. Doch das Beispiel oben zeigt, dass beim Konsumieren solcher Wahlanalysen Vorsicht geboten ist: Aggregatdaten sind oft sehr informativ, weil sie interessante geografische Tendenzen sichtbar machen können. Sie lassen aber keine Schlüsse auf das individuelle Verhalten von Wählerinnen und Wählern zu (das gilt im Übrigen auch für Wählerstromanalysen). (Laurenz Ennser-Jedenastik, 27.7.2017)