concepts

Goodhart's Law

Wenn eine Kennzahl zum Ziel wird, verliert sie als Messgröße an Aussagekraft, weil das System beginnt, auf den Proxy statt auf die eigentliche Wirkung zu optimieren.

technologyteamsorganization·5 min Lesezeit

Was ist das?

Wenn eine Kennzahl zum Ziel wird, verliert sie als Messgröße an Aussagekraft, weil das System beginnt, auf den Proxy statt auf die eigentliche Wirkung zu optimieren.

Warum relevant?

Nutze dieses Konzept, um beobachtbares Verhalten nicht nur zu benennen, sondern strukturell zu erklären.

Nächster Schritt

Prüfe danach, welcher Archetyp oder welche Diagnose das Muster im konkreten System sichtbar macht.

~6 Min. Lesezeit

Definition

Goodhart's Law beschreibt ein wiederkehrendes Steuerungsproblem: Sobald eine Kennzahl nicht mehr nur beobachtet, sondern als Zielgröße mit Konsequenzen versehen wird, verändert sich das Verhalten der beteiligten Akteure in Richtung dieser Kennzahl. Die Metrik misst dann nicht mehr zuverlässig die eigentliche Qualität des Systems, sondern zunehmend die Anpassung an die Messlogik. In der Kurzform: Wenn ein Maß zum Ziel wird, taugt es als Maß immer weniger.

Wichtig ist daran nicht nur der KPI-Aspekt, sondern die Systemdynamik dahinter. Die Kennzahl ist meist nur ein Proxy für etwas Tieferes, etwa Kundennutzen, Architekturqualität, Lernfähigkeit oder Resilienz. Sobald der Proxy mit Boni, Priorität, Sichtbarkeit oder Sanktionen verknüpft wird, beginnt das System, den Proxy selbst zu produzieren. Dadurch entstehen Umgehungslogiken, lokale Optimierung, Reporting-Schönfärbung und Nebenwirkungen, die im Dashboard oft erst spät sichtbar werden.

Systemmechanismus

Systemisch betrachtet ist Goodhart's Law keine moralische Schwäche einzelner Menschen, sondern eine erwartbare Anpassung in einem rückgekoppelten System. Eine Organisation setzt eine Kennzahl, zum Beispiel Deployment Frequency, Auslastung, Ticket-Durchsatz oder Budgettreue. Diese Kennzahl wird sichtbar gemacht, verglichen und mit Erwartungen verbunden. Teams reagieren darauf rational. Sie passen Prioritäten, Zerlegung von Arbeit, Eskalationsverhalten und Berichtswesen so an, dass die Metrik besser aussieht. Genau dadurch verschiebt sich jedoch das Gesamtsystem: Was gemessen wird, wird verstärkt; was nicht gemessen wird, verliert Aufmerksamkeit.

Das erzeugt meist mindestens drei Effekte zugleich. Erstens verengt sich der Blick auf einen Proxy, während andere Wirkdimensionen aus der Boundary herausfallen. Zweitens entstehen neue Feedback Loops: gutes Abschneiden in der Kennzahl bringt mehr Anerkennung, Budgets oder Einfluss und verstärkt damit genau das Metrik-orientierte Verhalten. Drittens nimmt die Diagnosequalität ab, weil die Zahl zwar stabil oder positiv aussieht, aber immer weniger mit echter Systemleistung korreliert. Goodhart's Law ist deshalb eng verwandt mit Feedback Loops, lokaler Optimierung, Policy Resistance und Incentive Design.

Architekturbeispiel

Ein Unternehmen will die Delivery-Leistung verbessern und steuert die Plattform- und Produktteams primär über Deployment Frequency. Anfangs scheint das vernünftig, weil häufige Releases oft mit kleinen Batch Sizes und schnellerem Lernen zusammenhängen. Nach wenigen Monaten kippt die Logik. Teams schneiden Änderungen künstlich in Mini-Deployments, bündeln riskante Architekturarbeiten in intransparente Vorbereitungs-Tasks oder verschieben Stabilisierungsthemen in spätere Quartale. Die Kennzahl steigt, aber gleichzeitig nehmen Incident-Last, kognitive Überlastung und versteckte Kopplung zu. Die Metrik misst nun vor allem Release-Taktik, nicht mehr Delivery-Fähigkeit.

Ein ähnliches Muster sieht man bei Verfügbarkeitszielen ohne Kontext. Wenn ein Team nur auf eine einzelne Uptime-Zahl optimiert, kann es sinnvolle Releases verzögern, Störungen enger definieren oder Support-Fälle aus der Messung heraushalten. Das System erscheint formell stabiler, verliert aber an Lern- und Anpassungsfähigkeit. Die Kennzahl verbessert sich, während die eigentliche Resilienz sinkt.

Organisationsbeispiel

In einer Matrixorganisation werden Bereichsleiter an Budgettreue und Auslastung gemessen. Das führt dazu, dass Teams möglichst voll ausgelastet geplant, Spezialisten ungern verliehen und bereichsübergreifende Verbesserungen blockiert werden. Für den einzelnen Bereich ist das rational, für das Gesamtsystem jedoch schädlich: Warteschlangen wachsen, Prioritäten verhärten sich und gemeinsame Wertströme werden langsamer. Niemand handelt "falsch" im engeren Sinne. Das System honoriert lediglich die Proxy-Optimierung stärker als die gemeinsame Wirkung.

Besonders riskant wird das, wenn Kennzahlen auf Hierarchieebenen unterschiedlich wirken. Top-Management möchte Kundennutzen, mittlere Führung berichtet Kostenstabilität und Teams optimieren auf Durchsatz. Dann entstehen Konflikte zwischen Metriken, die sich gegenseitig unterlaufen. Goodhart's Law ist hier kein isolierter Kennzahlenfehler, sondern Ausdruck einer nicht abgestimmten Steuerungsarchitektur.

Diagnosefragen

1.Welche Kennzahl hat bei uns spürbar mehr Macht als das eigentliche Ziel, das sie nur approximieren soll?

2.Welches Verhalten wird rational belohnt, obwohl es die Gesamtleistung des Systems verschlechtert?

3.Wo sehen unsere Dashboards gut aus, während Friktion, Nebenwirkungen oder Umgehungslogiken im Alltag zunehmen?

Diagramm

Warum dieses Konzept in Architektur hilft

Architekturentscheidungen leiden häufig darunter, dass schwer messbare Qualitäten wie Entkopplung, Änderbarkeit, Lernfähigkeit oder Entscheidungsqualität durch einfache Proxys ersetzt werden. Das ist zunächst unvermeidbar, weil komplexe Systeme nicht vollständig direkt beobachtbar sind. Goodhart's Law hilft jedoch, diese Proxys nicht mit der Realität zu verwechseln. Es erinnert daran, dass Messung immer ein Eingriff in das System ist und deshalb Nebenwirkungen erzeugt.

Für Architekturarbeit ist das besonders wertvoll, weil viele Fehlsteuerungen wie "mehr Tickets erledigt", "mehr Services gebaut" oder "mehr Standards formal erfüllt" nach Fortschritt aussehen, obwohl sie strukturell in die falsche Richtung laufen. Wer Goodhart's Law kennt, schaut nicht nur auf Zielwerte, sondern auf Verhaltensänderungen, ausgelassene Effekte und verdrängte Qualitätsdimensionen.

Woran du das Konzept von ähnlichen Themen unterscheidest

Goodhart's Law ist verwandt mit lokaler Optimierung, aber präziser. Lokale Optimierung beschreibt, dass Teile rational für sich selbst optimieren und damit dem Gesamtsystem schaden. Goodhart's Law erklärt zusätzlich, warum Metriken und Zielgrößen genau dieses Verhalten auslösen oder verstärken. Es ist auch verwandt mit Policy Resistance: Dort unterläuft das System eine Intervention. Bei Goodhart's Law liegt die Verzerrung spezifisch in der Transformation einer Beobachtungsgröße in eine Steuerungsgröße.

Wie du das Konzept praktisch nutzt

Nutze Kennzahlen als Hypothesen- und Gesprächsanlässe, nicht als alleinstehende Wahrheit. Gute Steuerung kombiniert deshalb mehrere Perspektiven: eine Leistungsmetrik, eine Nebenwirkungsmetrik und qualitative Beobachtungen aus dem realen Arbeitsfluss. Noch wichtiger ist die Frage, welche Entscheidungen die Kennzahl konkret beeinflusst. Eine Metrik ohne Sanktionswirkung verhält sich anders als eine Metrik, an der Budget, Bonus oder Sichtbarkeit hängen.

Hilfreich ist außerdem, Metriken regelmäßig gegen ihr ursprüngliches Zielbild zurückzuprüfen. Wenn die Zahl steigt, aber Beschwerden, Nacharbeit, politische Reibung oder technische Schulden ebenfalls steigen, ist die Messlogik selbst prüfungsbedürftig. Dann sollte man nicht "härter steuern", sondern die Proxy-Wahl, Boundary und Incentives neu gestalten.

Erste Umsetzungsschritte

Beginne mit einer kleinen Metrik-Inventur: Für jede kritische Steuerungskennzahl notierst du, welches eigentliche Ziel sie approximieren soll, welche unerwünschten Anpassungen sie provozieren könnte und welche zweite Beobachtung die Verzerrung früh sichtbar machen würde. Genau daraus entstehen robustere Governance-Mechanismen, bessere Dashboards und sinnvollere Review-Gespräche.

Woran du Wirkung erkennst

Ein gutes Zeichen ist, wenn Teams nicht nur Zielwerte berichten, sondern offen über Trade-offs, Messgrenzen und beobachtete Nebenwirkungen sprechen. Dann steuert die Organisation nicht mehr auf die Zahl allein, sondern lernt am System.