Beamtenbewertung per Normalverteilung

Martin Ueding

2023-03-13

Code & Zahlen

Der öffentliche Dienst hat einige markante Alleinstellungsmerkmale im Vergleich zur freien Wirtschaft. Eines davon ist die Bewertung per Normalverteilung. Das klingt erstmal wissenschaftlich fundiert, stellt sich aber als merkwürdig heraus.

Mitarbeiter*innen zu objektiv zu bewerten ist nicht einfach. Das alleine reicht auch nicht, man muss sie auch wertschätzend bewerten, ansonsten schwindet die Motivation. Innere Kündigungen sind eine die extreme Folge, falls das nicht klappt. In der freien Wirtschaft werden die Gehälter individuell ausgehandelt.

Im öffentlichen Dienst hat man die verschiedenen Besoldungsgruppen von A 2 bis A 16 und dann weiter mit B. Die Besoldungsgruppe bekommt man nicht unmittelbar nach Leistung, vielmehr werden Stellen mit einer bestimmten Besoldungsgruppe versehen. Wenn man jene Stelle bekommt, dann bekommt man auch jene Besoldungsgruppe. Dafür muss man entsprechende Qualifikationen mitbringen, zum Beispiel ab A 13 braucht man in der Regel einen Masterabschluss.

Dann bekommt man einfach nur durch Dienstalter noch Stufen. Für die Tarifbeschäftigten mit den E-Besoldungen bekommt man nach einem Jahr in Stufe 1 die Stufe 2, nach zwei Jahren in Stufe 2 die Stufe 3 und so weiter. Bei den Beamten ist das ähnlich, da gibt es nach einiger Zeit die nächste Stufe.

Wie kommt man jetzt in die nächste Besoldungsgruppe? Man muss dazu auf eine Stelle wechseln, die anders besoldet ist. Dafür braucht man eine oder mehrere positive Beurteilungen. Und da wird es dann meiner Meinung nach schnell absurd.

Schaut man hier in den Wikipedia-Artikel zur dienstlichen Beurteilung, findet man diese tolle Stelle:

Die Mechanismen, wie Beurteilungen entstehen, sind je nach Dienstherr unterschiedlich. Teilweise wird mit „Reihungssprengeln“ mehrerer Dienststellen und/oder mit Quotierungen der Prädikate in Anlehnung an die Gauß'sche Normalverteilung gearbeitet.

Diese »Quotierung in Anlehnung an die Normalverteilung« bedeutet, dass es bei jeder Bewertungsrunde pro Abteilung eine feste Anzahl pro Note (A, B, C, D, E) gibt. Der Mittelwert ist bei C gesetzt, die Standardabweichung wird gewählt. Somit gibt es einige wenige A und E, etwas mehr B und D, und am meisten C. Die relativen Häufigkeiten der Noten untereinander wird durch die Normalverteilung festgelegt.

Diese festen Noten müssen nun auf die Personen aufgeteilt werden. Dabei ist eigentlich direkt offensichlich, dass das nicht aufgehen kann. Die guten Noten sind natürlich heiß begehrt, weil man nur mit A oder B befördert werden kann. Die Führungskraft muss sich also überlegen wer im Team demnächst eine Beförderung bekommen kann, und wer auf das Abstellgleis gestellt wird. Dabei ist es bei einem Team nur aus Genies und ein Team nur aus Idioten das gleiche, die Anzahl der guten Bewertungen ist gleich, der Rest bekommt mittlere oder schlechte Bewertungen.

Verschärft wird das ganze dadurch, dass diese Statistik nicht pro Führungskraft gilt, sondern teilweise pro Abteilung. Die unteren Führungskräfte müssen sich also um das Kontingent an Noten streiten, das sie für ihre Leute bekommen. Wer da gut verhandelt kann sich viele A und B mitnehmen, während schlechte Verhandler*innen dann ihrem Team die D und E verpassen müssen. Die ganze Sache bekommt eine politische Dimension.

An sich verstehe ich die Motivation dahinter, es soll nicht jedem einfach nur ein A gegeben werden, wodurch die Noten effektiv wertlos werden. Bei Abiturnoten gibt es viele die das 1,0 schaffen, wodurch sie sich allerdings nicht mehr gegenüber den anderen mit 1,0 differenzieren können.

Wenn man aber vorher die Verteilung festlegt, aus denen man die Noten zieht, dann wirft man direkt viele Freiheitsgrade weg. Ich halte es für durchaus realistisch, dass gerade in kleineren Teams oder Abteilung die Leistung weder normalverteilt ist noch den Mittelwert C hat. Das würde bedeuten, dass man die Leute einfach nur aus der Gesellschaft zufällig gezogen hat. Falls das aber der Fall wäre, würden die Auswahlprozesse nicht sinnvoll funktionieren. Man sucht sich ja gerade die guten Leute raus.

Am Ende passiert das hier: Man sortiert die Leute nach ihrer Leistung. Und dann vergibt man einfach die Noten von gut nach schlecht entlang dieser Schlange. Die Noten sagen also aus, wo man in der Schlange stand, und nicht, wie gut man absolut war. War man also mit lauter Idioten in einem Team, bekommt man ein A. Ist man lauter Strebern in einem Team, bekommt man ein E. Und gerade wenn man in einer Gruppe sich zwar Mühe gibt, aber keine guten Noten mehr da waren, bekommt man eine schlechte Note. Irgendwer musste sie ja bekommen, damit am Ende die Statistik stimmt.

Das ist richtig demotivierend. Man findet Artikel von Haufe zu dem Thema, auch einen Artikel einer Rechtsanwaltskanzlei, die das Thema ziemlich absägt.

Dazu kommt noch die politische Dimension. Will man befördert werden, so muss man sich eine der Beurteilungen mit A oder B sichern. Dazu muss man gar nicht objektiv gut sein, man muss nur seiner Führungskraft das entsprechend darstellen. Diese muss dann aber auch genug Schneid haben um innerhalb der Abteilung ein hinreichend großes Quota an guten Bewertungen abzubekommen. Da muss man dann seine Führungskraft schon entsprechend in Stellung bringen, damit das auch klappen kann. Letztlich ist das System komplexer als in der freien Wirtschaft, wo ich mit einer Liste an Erfolgen zu meiner Führungskraft gehen kann und direkt das Gehalt verhandeln kann. Wie viel Erfolg man dort hat steht auf einem anderen Blatt, aber es ist kein Nullsummenspiel mit den Kolleg*innen.

Natürlich haben Leute dagegen geklagt. So richtig schlau werde ich aus der Klage nicht, aber dieser Satz hier ist schon bezeichnend:

Die grundsätzliche Kritik am System der neuen Beurteilungsrichtlinie, insbesondere an der Orientierung des Maßstabes an der Gaußschen Normalverteilung und an der Bildung eines Gesamturteils mit Binnendifferenzierung, war bereits Gegenstand zahlreicher gerichtlicher Entscheidungen und wurde zurückgewiesen (vgl. Nds. OVG, Beschl. v. 19.10.2009, 5 ME 175/09, juris; Beschl. v. 17.09.2009, 5 ME 181/09, V.n.b.).

Da haben also schon viele geklagt und das hat man bisher vor Gericht so stehengelassen.

Für mich erscheint das grober Unfug und falsch angewandte Statistik. Aber wenn die Rechtssprechung sagt, dass man das so machen kann, dann ist das halt so. Ob das mathematisch sinnvoll ist, spielt vor Gericht halt keine Rolle.

Und somit bleibt es ein willkürliches System, bei der die Willkür nur halt noch zusätzlich mit einer Normalverteilung parametrisiert worden ist.