Data Science mit Wahl-o-Mat

Als ich mal den Wahl-o-Mat ausprobiert hatte und mir danach die Stellungnahmen der einzelnen Parteien angeschaut habe, so wirkten einige Parteien ziemlich redundant. So fragte ich mich, ob man anhand der Fragen wirklich alle Parteien ausdifferenzieren kann, oder ob die teilweise fast das gleiche geantwortet hatten. Also habe ich die Positionen der Parteien vom Wahl-o-Mat genommen und mit $-1$, $0$ und $+1$ kodiert als Tabelle gespeichert.

Im weiteren habe ich dann die Korrelation zwischen Parteien und den Fragen untersucht. Mit Hilfe einer Hauptkomponentenanalyse kann man dann auch noch Richtungen finden, anhand derer sich die Parteien m├Âglichst pr├Ągnant einsortieren lassen k├Ânnen. Ich suche noch nach Clustern und untersuche auch die Fragen noch ein bisschen. Die Ergebnisse sind in interaktiven Grafiken dargestellt.

Korrelation

Als erstes k├Ânnen wir uns eine Spearman-Korrelation zwischen den Parteien anschauen. Dunkles Gr├╝n ist eine starke Korrelation in den Antworten, wei├č ist keine Korrelation und dunkles Magenta ist eine starke Antikorrelation. Man kann mit der Maus ├╝ber die Grafik gehen, dann wird der genaue Wert der Korrelation als Tooltip angezeigt.

Interessant finde ich zum Beispiel, wie CDU und SPD komplett unterschiedliche Richtungen zu bedienen scheinen. Gr├╝ne und AfD sind dagegen so ziemliche Gegens├Ątze, m├Âglicherweise versucht die AfD gerade das Gegenteil der Gr├╝nen zu sein. Wenig ├╝berraschend haben Gr├╝ne und Linke ziemlich gro├če ├ťberschneidungen. Die SPD ist mit keiner anderen Partei wirklich stark korreliert, die scheinen ihr eigenes Ding zu machen.

Mit den Daten k├Ânnen wir aber noch mehr machen, als nur eine einfache Korrelation zu betrachten.

Hauptkomponentenanalyse

Die 38 Fragen k├Ânnen als Dimensionen eines Raumes aufgefasst werden. Jede Partei ist darin ein Punkt, den wir auch als Ursprungsvektor verstehen k├Ânnen. Die Korrelation zwischen Parteien ist dann letztlich analog zu dem Winkel zwischen den Vektoren in diesem hochdimensionalem Raum. Diesen k├Ânnen wir nicht direkt betrachten.

├ťber eine Hauptkomponentenanalyse kann man diese 38 Dimensionen allerdings auf 2 reduzieren und dann darstellen. Im folgenden Plot sind die Parteien anhand der zwei Komponenten dargestellt. Der Plot ist interaktiv, man kann durch Ziehen den Ausschnitt verschieben und mit dem Mausrad zoomen.

Mir ist nicht so ganz klar, was diese zwei Achsen genau aussagen. Die erste Achse scheint irgendwie so grob das klassische links/rechts zu sein, die zweite Achse vielleicht liberal/autorit├Ąr.

Achsen

Man kann sich die Gewichtung der Fragen geben lassen, aus denen die beiden Hauptachsen bestehen. Dadurch erhalten wir f├╝r beide Achsen nochmal einen weiteren Plot. Im Tooltip ├╝ber den Balken ist der komplette Fragetext sichtbar. Eine starke positive Gewichtung zeigt an, dass diese Frage zu gro├čen positiven Ausschl├Ągen in der Komponente f├╝hrt. Eine starke negative Gewichtung l├Ąsst die Frage zu einem starken negativen Ausschlag f├╝hren. Kleine Gewichte zeigen an, dass die Frage eher bedeutungslos f├╝r diese Hauptachse ist.

F├╝r die erste Hauptachse haben wir diese Fragengewichte:

Und f├╝r die zweite Hauptachse haben wir diese Gewichte:

So richtig schlau bin ich daraus bisher aber nicht geworden. Falls jemand das Muster sieht, w├╝rde ich mich ├╝ber einen Tipp freuen.

Korrespondenzanalyse

Die oben genutzte Hauptkomponentenanalyse ist eigentlich f├╝r kontinuierliche Gr├Â├čen gedacht. Da die Antworten aber auf einer Ordinalskala sind, ist die Korrespondenzanalyse wohl die bessere Wahl. Damit bekomme ich jedoch nur eine Dimension richtig raus, der Rest scheint nicht signifikant genug zu sein. Das Ergebnis ist dieses:

Das sieht nach dem ganz klassischen links/rechts aus.

Cluster

Wir k├Ânnen auch direkt in dem Raum mit 38 Dimensionen nach Clustern suchen. Da mir das Abstandsma├č in diesem Raum nicht ganz klar ist, werde ich hier erstmal mit k-Means anfangen. Der Algorithmus versucht eine feste Anzahl Cluster zu finden. Je nach Anzahl kommen da komplett andere Dinge raus.

Zwei Cluster

Zwingt man eine Einteilung in zwei Cluster, so sind das die beiden Ergebnisse:

  • Demokratie in Bewegung, Deutsche Kommunistische Partei, Die Humanisten, Die PARTEI, Die Urbane, GR├ťNE, LINKE, Lobbyisten f├╝r Kinder, Marxistisch-Leninistische Partei Deutschlands, Partei f├╝r Ver├Ąnderung, Vegetarier und Veganer, PIRATEN, Sozialistische Gleichheitspartei, SPD, S├╝dschleswiger W├Ąhlerverband, Tierschutzallianz, Tierschutzpartei, Volt, ├ľkologisch-Demokratische Partei
  • AfD, Bayernpartei, B├╝ndnis 21, B├╝ndnis C - Christen f├╝r Deutschland, B├╝rgerbewegung f├╝r Fortschritt und Wandel, B├╝rgerrechtsbewegung Solidarit├Ąt, CDU/CSU, Der 3. Weg, Die Grauen, dieBasis, Europ├Ąische Partei LIEBE, FDP, FREIE W├äHLER, Gesundheitsforschung, Liberal-Konservative Reformer, Menschliche Welt, NPD, Partei des Fortschritts, Team Todenh├Âfer, Unabh├Ąngige f├╝r b├╝rgernahe Demokratie

Das sind so aus, als w├Ąre der erste der links-gr├╝ne Cluster, der zweite enth├Ąlt die konservativen Parteien.

Drei Cluster

Bei einem Cluster mehr ist es dann schon interessant, wie sich das f├╝gt:

  • Demokratie in Bewegung, Deutsche Kommunistische Partei, Die Humanisten, Die PARTEI, Die Urbane, GR├ťNE, LINKE, Lobbyisten f├╝r Kinder, Marxistisch-Leninistische Partei Deutschlands, Partei des Fortschritts, Partei f├╝r Ver├Ąnderung, Vegetarier und Veganer, PIRATEN, Sozialistische Gleichheitspartei, SPD, S├╝dschleswiger W├Ąhlerverband, Team Todenh├Âfer, Tierschutzallianz, Tierschutzpartei, Volt, ├ľkologisch-Demokratische Partei
  • B├╝rgerbewegung f├╝r Fortschritt und Wandel, B├╝rgerrechtsbewegung Solidarit├Ąt, Der 3. Weg, Die Grauen, dieBasis, Europ├Ąische Partei LIEBE, Gesundheitsforschung, Menschliche Welt, NPD, Unabh├Ąngige f├╝r b├╝rgernahe Demokratie
  • AfD, Bayernpartei, B├╝ndnis 21, B├╝ndnis C - Christen f├╝r Deutschland, CDU/CSU, FDP, FREIE W├äHLER, Liberal-Konservative Reformer

Das erste w├╝rde ich wieder als erweitertes links-gr├╝n sehen. Der zweite scheinen die wirklich rechten Parteien zu sein, der dritte dann die m├Ą├čig bis extrem Konservativen. Interessant ist, dass die AfD mit ihren Antworten im dritten und nicht im zweiten Cluster ist.

Vier Cluster

Bei vier Clustern ver├Ąndert sich nicht so viel, es gibt nur noch einen neuen ersten Cluster, dem ich nicht so recht einen Namen geben kann.

  • Die Humanisten, FREIE W├äHLER, Partei des Fortschritts, Team Todenh├Âfer
  • Demokratie in Bewegung, Deutsche Kommunistische Partei, Die PARTEI, Die Urbane, GR├ťNE, LINKE, Lobbyisten f├╝r Kinder, Marxistisch-Leninistische Partei Deutschlands, Partei f├╝r Ver├Ąnderung, Vegetarier und Veganer, PIRATEN, Sozialistische Gleichheitspartei, SPD, S├╝dschleswiger W├Ąhlerverband, Tierschutzallianz, Tierschutzpartei, Volt, ├ľkologisch-Demokratische Partei
  • AfD, Bayernpartei, B├╝ndnis C - Christen f├╝r Deutschland, CDU/CSU, FDP, Liberal-Konservative Reformer
  • B├╝ndnis 21, B├╝rgerbewegung f├╝r Fortschritt und Wandel, B├╝rgerrechtsbewegung Solidarit├Ąt, Der 3. Weg, Die Grauen, dieBasis, Europ├Ąische Partei LIEBE, Gesundheitsforschung, Menschliche Welt, NPD, Unabh├Ąngige f├╝r b├╝rgernahe Demokratie

F├╝nf Cluster

Mit einem weiteren Cluster scheint sich nur B├╝ndnis 21 und B├╝So abzuspalten.

  • Die Humanisten, Partei des Fortschritts, PIRATEN, Team Todenh├Âfer
  • Demokratie in Bewegung, Deutsche Kommunistische Partei, Die PARTEI, Die Urbane, GR├ťNE, LINKE, Lobbyisten f├╝r Kinder, Marxistisch-Leninistische Partei Deutschlands, Partei f├╝r Ver├Ąnderung, Vegetarier und Veganer, Sozialistische Gleichheitspartei, SPD, S├╝dschleswiger W├Ąhlerverband, Tierschutzallianz, Tierschutzpartei, Volt, ├ľkologisch-Demokratische Partei
  • B├╝ndnis 21, B├╝rgerrechtsbewegung Solidarit├Ąt
  • AfD, Bayernpartei, B├╝ndnis C - Christen f├╝r Deutschland, CDU/CSU, FDP, FREIE W├äHLER, Liberal-Konservative Reformer
  • B├╝rgerbewegung f├╝r Fortschritt und Wandel, Der 3. Weg, Die Grauen, dieBasis, Europ├Ąische Partei LIEBE, Gesundheitsforschung, Menschliche Welt, NPD, Unabh├Ąngige f├╝r b├╝rgernahe Demokratie

Zehn Cluster

Nimmt man 10 Cluster, so bekommt man es deutlich kleiner differenziert.

  • CDU/CSU, FDP, FREIE W├äHLER
  • Deutsche Kommunistische Partei, Die Humanisten, PIRATEN, Sozialistische Gleichheitspartei, Team Todenh├Âfer, Tierschutzallianz
  • B├╝rgerbewegung f├╝r Fortschritt und Wandel, Der 3. Weg, Die Grauen, dieBasis, Gesundheitsforschung, Menschliche Welt, NPD, Unabh├Ąngige f├╝r b├╝rgernahe Demokratie
  • S├╝dschleswiger W├Ąhlerverband, Volt
  • Partei des Fortschritts, SPD
  • B├╝ndnis 21
  • Demokratie in Bewegung, Die PARTEI, Die Urbane, GR├ťNE, LINKE, Lobbyisten f├╝r Kinder, Marxistisch-Leninistische Partei Deutschlands, Partei f├╝r Ver├Ąnderung, Vegetarier und Veganer, Tierschutzpartei, ├ľkologisch-Demokratische Partei
  • B├╝rgerrechtsbewegung Solidarit├Ąt
  • Europ├Ąische Partei LIEBE
  • AfD, Bayernpartei, B├╝ndnis C - Christen f├╝r Deutschland, Liberal-Konservative Reformer

Interessant ist, dass sich nun CDU, FDP, Freie W├Ąhler von AfD und LKR abspalten. Bei den links-gr├╝nen Parteien ist allerdings noch fast alles innerhalb von einem Cluster.

Analyse der Fragen

Wir k├Ânnen uns auch die Fragen einmal anschauen.

Korrelation

Welche Fragen sind stark korreliert mit anderen Fragen?

Man kann ein paar Dinge sehen:

  • Die Frage nach Tempolimit und Zukunft nach Verbrennungsmotor sind sehr korreliert und damit fast redundant. Das ├╝berrascht nicht
  • Fr├╝herer Kohleausstieg und Wahlrecht ab 16 ist ebenfalls stark korreliert, Parteien sind also eher f├╝r die Jugend oder nicht.
  • Doppelte Staatsb├╝rgerschaft und F├Ârderung von Windenergie h├Ąngen auch stark zusammen. Das ist unerwartet.
  • Verbrennungsmotor und Wahlrecht ab 16 ist auch korreliert, das ├╝berrascht mit den anderen Korrelationen wenig.
  • ├ľkologische Landwirtschaft und gesetzliche Rente ist ebenfalls korreliert. Das scheint dann wieder ein gesamtgesellschaftliches Denken zu sein, das sich da pr├Ąsentiert.
  • Asyl nur f├╝r politisch Verfolgte und die Erh├Âhung von Verteidigungsausgaben ist auch korreliert. Das ├╝berrascht wenig.
  • Mindestlohnanhebung und Verm├Âgenssteuer ist auch korreliert, wenig ├╝berraschend.

Hauptkomponentenanalyse

Auch mit den Fragen k├Ânnen wir eine Hauptkomponentenanalyse machen. Das ist dabei allerdings etwas schwerer, weil gewisse Fragen positiv und negativ formuliert werden k├Ânnen. Dadurch ergibt sich ein eher gespiegeltes Spektrum.

Die Gewichtung der Parteien f├╝r die Fragen k├Ânnen wir ebenfalls f├╝r die beiden Hauptachsen darstellen. Daraus k├Ânnen wir dann ableiten, welche der Hauptachse welche Parteien besonders unterscheiden kann.

So richtig schlau bin ich daraus aber auch noch nicht geworden.

Korrespondenzanalyse

Auch hier kann man eine Korrespondenzanalyse machen und erh├Ąlt das recht offensichtliche links/rechts Spektrum der Parteien.

Cluster

Bei den Fragen kann man auch Cluster bilden. Diesmal ist jede Frage ein Vektor im Raum der Parteien. Ich habe einmal f├╝nf Cluster mit k-Means ausprobiert. Das hier kommt dabei raus:

Erster Cluster, geht anscheinend um finanzielle Vorteile f├╝r Privatpersonen und Unternehmen.

  • Auch Ehepaare ohne Kinder sollen weiterhin steuerlich beg├╝nstigt werden.
  • Der Staat soll weiterhin f├╝r Religionsgemeinschaften die Kirchensteuer einziehen.
  • Impfstoffe gegen Covid-19 sollen weiterhin durch Patente gesch├╝tzt sein.
  • Spenden von Unternehmen an Parteien sollen weiterhin erlaubt sein.

Der zweite Cluster bezieht sich auf Fragen bez├╝glich Toleranz, R├╝cksicht auf die Umwelt, mehr Rechte f├╝r Jugendliche.

  • Auf allen Autobahnen soll ein generelles Tempolimit gelten.
  • Bei Bundestagswahlen sollen auch Jugendliche ab 16 Jahren w├Ąhlen d├╝rfen.
  • Bundesbeh├Ârden sollen in ihren Ver├Âffentlichungen unterschiedliche Ge schlechtsidentit├Ąten sprachlich ber├╝cksichtigen.
  • Das Tragen eines Kopftuchs soll Beamtinnen im Dienst generell erlaubt sein.
  • Der Bund soll Projekte zur Bek├Ąmpfung des Antisemitismus st├Ąrker finanziell unterst├╝tzen.
  • Der f├╝r das Jahr 2038 geplante Ausstieg aus der Kohleverstromung soll vorgezogen werden.
  • Der kontrollierte Verkauf von Cannabis soll generell erlaubt sein.
  • Der staatlich festgelegte Preis f├╝r den Aussto├č von CO2 beim Heizen und Autofahren soll st├Ąrker steigen als geplant.
  • Die Landeslisten der Parteien f├╝r die Wahlen zum Deutschen Bundestag sollen abwechselnd mit Frauen und M├Ąnnern besetzt werden m├╝ssen.
  • In Deutschland soll es generell m├Âglich sein, neben der deutschen eine zweite Staatsb├╝rgerschaft zu haben.
  • Islamische Verb├Ąnde sollen als Religionsgemeinschaften staatlich anerkannt werden k├Ânnen.
  • Studentinnen und Studenten sollen BAf├ÂG unabh├Ąngig vom Einkommen ihrer Eltern erhalten.

Der dritte Cluster enth├Ąlt sehr konservative Fragen. Interessant finde ich, dass die Fallpauschale auch hier gelandet ist, und nicht im ersten Cluster.

  • Bei der Video├╝berwachung ├Âffentlicher Pl├Ątze soll Gesichtserkennungssoftware eingesetzt werden d├╝rfen.
  • Das Recht anerkannter Fl├╝chtlinge auf Familiennachzug soll abgeschafft werden.
  • Deutschland soll aus der Europ├Ąischen Union austreten.
  • Die F├Ârderung von Windenergie soll beendet werden.
  • Die traditionelle Familie aus Vater, Mutter und Kindern soll st├Ąrker als andere Lebensgemeinschaften gef├Ârdert werden.
  • Station├Ąre Behandlungen im Krankenhaus sollen weiterhin ├╝ber eine Fallpauschale abgerechnet werden.

Im vierten Cluster sind die Fragen gelandet, in denen es um h├Âhere Steuern und bessere soziale Absicherung geht, also linke Haushaltsfragen.

  • Alle Erwerbst├Ątigen sollen in der gesetzlichen Rentenversicherung versichert sein m├╝ssen.
  • Auf den Umsatz, der in Deutschland mit digitalen Dienstleistungen erzielt wird, soll eine nationale Steuer erhoben werden.
  • Auf hohe Verm├Âgen soll wieder eine Steuer erhoben werden.
  • Der Bund soll mehr Zust├Ąndigkeiten in der Schulpolitik erhalten.
  • Der Flugverkehr soll h├Âher besteuert werden.
  • Der gesetzliche Mindestlohn soll sp├Ątestens im Jahr 2022 auf mindestens 12 Euro erh├Âht werden.
  • Die M├Âglichkeiten der Vermieterinnen und Vermieter, Wohnungsmieten zu erh├Âhen, sollen gesetzlich st├Ąrker begrenzt werden.
  • ├ľkologische Landwirtschaft soll st├Ąrker gef├Ârdert werden als konventionelle Landwirtschaft.

Im f├╝nften Cluster sind Fragen, die gegen Globalisierung gehen. Witzigerweise ist auch der Verbrennungsmotor und die Arbeitgeberseite beim Homeoffice dabei.

  • Asyl soll weiterhin nur politisch Verfolgten gew├Ąhrt werden.
  • Chinesische Firmen sollen keine Auftr├Ąge f├╝r den d├╝rfen. Ausbau der Kommunikationsinfrastruktur in Deutschland erhalten
  • Der Solidarit├Ątszuschlag soll vollst├Ąndig abgeschafft werden.
  • Deutschland soll seine Verteidigungsausgaben erh├Âhen.
  • Die Ostsee-Pipeline ÔÇ×Nord Stream2ÔÇť, die Gas von Russland nach Deutschland transportiert, soll wie geplant in Betrieb gehen d├╝rfen.
  • Die Schuldenbremse im Grundgesetz soll beibehalten werden.
  • Die Zulassung von neuen Autos mit Verbrennungsmotor soll auch langfristig m├Âglich sein.
  • Unternehmen sollen selbst entscheiden, ob sie ihren Besch├Ąftigten das Arbeiten im Homeoffice erlauben.

Die Trennung zwischen dem dritten und f├╝nften Cluster ist mir nicht so ganz klar, aber anscheinend steckt da etwas in den Daten drin.

Fazit

Es ist schon ganz lustig, dass man klassische Achsen wie rechts/links und liberal/autorit├Ąr auch in den Daten selbst finden kann. Viele kleinere Parteien scheinen, nur anhand ihrer Antworten gemessen, recht redundant zu sein. Bei ├╝ber 90 % Korrelation in den Antworten findet man nur diese Redundanz:

  • LINKE und Urbane

Bei ├╝ber 85 % jene:

  • DiB und Die Partei
  • DiB und LINKE
  • DiB und Urbane
  • LINKE und Urbane
  • Tierschutz und Vegan

Bei ├╝ber 80 % Korrelation hat man diese Parteien:

  • DiB und Die Partei
  • DiB und LINKE
  • DiB und Tierschutz
  • DiB und Urbane
  • DiB und Vegan
  • Die Partei und Tierschutz
  • Die Partei und Vegan
  • Gr├╝ne und LINKE
  • Gr├╝ne und Urbane
  • LINKE und MLPD
  • LINKE und Tierschutz
  • LINKE und Urbane
  • Tierschutz und Vegan

Wo man diese Schwelle jetzt setzt, um von ┬╗redundanten Parteien┬ź zu sprechen, ist subjektiv. Bei 80 % w├Ąren Gr├╝ne und LINKE schon gleichzusetzen, das entspricht angesichts der gro├čen W├Ąhlerzahlen dann wohl doch nicht dem Empfinden. Interessant ist aber, dass die LINKE mehr mit den Gr├╝nen als der SPD (aus der sie ja stammt) gemeinsam hat.

Angesichts der 5-%-H├╝rde ist scheint es sinnvoll eine der gr├Â├čeren Parteien zu w├Ąhlen, die stark mit der Wunschpartei korreliert ist.

Lustig ist auch noch zu schauen, wie es bei negativer Korrelation aussieht. Bei unter -70 % Korrelation findet man diese Gegens├Ątze:

  • AfD und Gr├╝ne
  • AfD und LINKE

Bei unter -60 % findet man dann noch diese hier:

  • AfD und DiB
  • AfD und Gr├╝ne
  • AfD und Kinder
  • AfD und LINKE
  • AfD und Tierschutz
  • AfD und Urbane

Es scheint, als sei die AfD haupts├Ąchlich einfach der Gegenpol zu vielen anderen Parteien. Es ist schon sehr interessant, dass andere rechte Parteien gar nicht so starke Gegenpole zu anderen Parteien sind. Es wirkt so, als wollte die AfD haupts├Ąchlich die W├Ąhler von anderen Parteien abgreifen, und weniger eigene Richtungen aufzeigen.

Making Of

Die Antworten der Parteien habe ich vom Wahl-o-Mat als PDF heruntergeladen und in eine Tabellendatei ├╝bertragen. Die Auswertung habe ich mit NumPy, Pandas gemacht, die Hauptkomponentenanalyse und Cluster mit Scikit-Learn, die Korrespondenzanalyse mit mca. Die Grafiken sind mit Altair erstellt. Der ganze Python-Code ist in einem Notebook verf├╝gbar.