Story Points schätzen und Fehler vermeiden – Story Points gehören für viele Teams zum agilen Alltag. Trotzdem kämpfen erstaunlich viele Organisationen mit unzuverlässigen Schätzungen, politischen Diskussionen um Velocity und Frust in der Planung. Die gute Nachricht: Die typischen Probleme sind lösbar – wenn Sie Story Points richtig verstehen, konsequent anwenden und ein paar verbreitete Irrtümer abräumen.
In diesem Leitfaden erfahren Sie, wie Sie Story Points so schätzen, dass Ihre Planung robuster wird, Ihr Team fokussierter arbeitet und Diskussionen sachlicher werden. Sie lernen konkrete Schritte, Workshop-Formate und Praxis-Checks kennen, mit denen Sie Fehler vermeiden und Ihre Schätzqualität systematisch verbessern.
1. Grundlagen: Was sind Story Points – und was nicht?
Kurzdefinition:
Story Points sind eine relative Maßeinheit, mit der ein agiles Team den Gesamtaufwand einer User Story bewertet – basierend auf:
- Umfang
- Komplexität
- Risiken und Unsicherheiten
Wichtige Klarstellungen:
- Story Points sind kein Zeitmaß (keine Stunden, keine Tage).
- Story Points sind teamindividuell – 5 Punkte bedeuten in Team A etwas anderes als in Team B.
- Story Points sind eine Entscheidungsgrundlage für Planung, keine exakten Prognosen.
Wozu Story Points überhaupt?
Story Points helfen Teams dabei, …
- Sprints realistisch zu planen
- Unsicherheit sichtbar zu machen
- fachliche Komplexität früh zu erkennen
- Diskussionen weg von „Wie lange dauert das?“ hin zu „Was steckt wirklich drin?“ zu lenken
Sie unterstützen Entscheider, weil:
- Lieferfähigkeit besser abschätzbar wird (Roadmaps, Releases)
- Abhängigkeiten und Engpässe früher sichtbar werden
- Priorisierung auf Nutzen vs. Aufwand fundierter möglich ist
2. Suchintention verstehen: Was wollen „Story Points“-Suchende wirklich?
Wer nach „Story Points schätzen und Fehler vermeiden“ sucht, hat in der Regel ein sehr praktisches Anliegen:
- „Wie schätze ich richtig?“
- „Warum passt unsere Velocity nie zur Realität?“
- „Wie verhindere ich, dass sich das Team ‚hochschätzt‘?“
- „Wie erkläre ich dem Management, dass Story Points keine Stunden sind?“
Die meisten Leser wollen konkrete Handlungsempfehlungen, keine agile Grundlagentheorie. Genau darauf ist dieser Leitfaden ausgerichtet: klare Schritte, Checklisten, Beispiele.
3. Die häufigsten Missverständnisse über Story Points
Schlechte Schätzungen entstehen selten durch das Werkzeug, fast immer durch falsche Erwartungen. Typische Missverständnisse:
3.1 Story Points = versteckte Stunden
Viele Teams beginnen mit Story Points, behalten aber innerlich ihr Denken in Stunden:
- „1 Punkt = 2 Stunden“
- „13 Punkte = etwa 3 Tage“
Problem:
- Druck, „pünktlich“ zu liefern
- Scham oder Rechtfertigungsdruck, wenn Stories „überziehen“
- Diskussionen über individuelle Performance
Konsequenz:
Die Vorteile relativer Schätzung gehen verloren. Story Points werden zur schlecht getarnten Zeitschätzung.
Besser: Story Points konsequent relativ nutzen:
„Ist diese Story ungefähr so aufwendig wie unsere 5-Punkte-Referenzstory – oder deutlich weniger/mehr?“
3.2 Story Points als Produktivitäts-Messgröße
Ein weiterer Klassiker: Velocity wird als KPI für Teamleistung oder als Benchmark zwischen Teams genutzt.
- „Team A hat 60 Punkte, Team B nur 35 – warum ist Team B so langsam?“
- „Wir müssen unsere Velocity steigern.“
Folgen:
- Teams beginnen, höher zu schätzen, um besser dazustehen.
- Stories werden künstlich gesplittet oder zusammengefasst.
- Fokus verschiebt sich von Wertschöpfung zu „Punkte-Maximierung“.
Ergebnis: Forecasts werden unbrauchbar, Vertrauen bröckelt.
Merksatz:
Story Points sind ein internes Planungswerkzeug, kein Controlling-Instrument.
3.3 Einheitliche Skala über mehrere Teams hinweg
Unternehmen versuchen häufig, eine „unternehmensweite Story-Point-Skala“ einzuführen, um Projekte, Abteilungen oder Lieferanten vergleichen zu können.
Problem:
- Teams arbeiten mit unterschiedlichen Technologien, Domänen, Reifegraden.
- Ein „8 Punkte“-Task im Data-Team ist nicht mit „8 Punkten“ im Frontend-Team vergleichbar.
- Endlose Diskussionen über Definitionen, kaum Mehrwert.
Besser:
- Story Points strikt teamlokal verwenden.
- Für unternehmensweite Steuerung lieber andere Maße (z. B. Durchlaufzeiten, Fertigstellungsgrade, geschäftlicher Outcome) nutzen.
4. Story Points richtig einführen: Schritt-für-Schritt
Wenn Sie Story Points neu einführen oder „retten“ möchten, gehen Sie strukturiert vor.
Schritt 1: Ziel klären – gemeinsam mit Stakeholdern
Beantworten Sie im Kreis aus Product Owner, Scrum Master/Agile Coach, Team und Management:
- Wofür wollen wir Story Points nutzen?
- Sprintplanung?
- Release-Planung?
- Kapazitätsabschätzung?
- Wofür wollen wir Story Points bewusst nicht nutzen?
- Individuelle Leistungsbewertung?
- Teamvergleiche?
Halten Sie diese Entscheidungen fest und kommunizieren Sie sie an alle Beteiligten.
Schritt 2: Referenz-Stories definieren
Das Herz guter Schätzung ist ein gemeinsames Bezugsraster.
Vorgehen:
- Nehmen Sie 5–10 abgeschlossene User Stories aus der Vergangenheit.
- Wählen Sie 3–5 Stories, die das Team „gut kennt“.
- Ordnen Sie ihnen gemeinsam Story-Point-Werte zu, z. B.:
- 1 Punkt: minimaler Aufwand, fast trivial
- 3 Punkte: typischer kleiner Task
- 5 Punkte: mittlere Komplexität, Standard-Fall
- 8 Punkte: größerer Baustein mit spürbaren Risiken
- Dokumentieren Sie diese Referenz-Stories im Wiki oder Backlog.
Diese Referenzen dienen künftig als „Messlatte“, an der Sie neue Stories ausrichten.
Schritt 3: Einheitliche Bewertungskriterien festlegen
Klare Kriterien verhindern endlose Debatten. Typische Dimensionen:
- fachlicher Umfang (Anzahl Use Cases, Szenarien)
- technische Komplexität (Integrationen, neue Technologien, Architektur-Änderungen)
- Risiken/Unsicherheit (unklare Anforderungen, Drittanbieter, Legacy-Systeme)
- Abhängigkeiten (andere Teams, externe Partner)
Ein Praxisansatz:
- Definieren Sie gemeinsam 3–5 Leitfragen, die bei jeder Schätzung beantwortet werden.
- Beispiel:
- „Wie neu ist dieses Thema für uns?“
- „Wie gut verstehen wir die Anforderungen?“
- „Wie viele Komponenten/Systeme sind betroffen?“
Schritt 4: Passende Skala wählen (Fibonacci & Co.)
Bewährt haben sich diskrete Skalen, z. B.:
- Fibonacci-Folge: 1, 2, 3, 5, 8, 13, 20, …
- oder eine reduzierte Variante: 1, 2, 3, 5, 8, 13
Warum keine feinere Skala (z. B. 4, 6, 7, 9)?
- Dunkelgrüne Genauigkeit ist Illusion – man schätzt nur vermeintlich präziser.
- Gröbere Stufen zwingen zu klaren Entscheidungen und Diskussion.
Empfehlung:
- Für Einsteiger-Teams: 1, 2, 3, 5, 8, 13
- Sehr reife Teams mit hohem Durchsatz können bei Bedarf 20 ergänzen.
Schritt 5: Gemeinsames Schätzverfahren festlegen (Planning Poker)
Planning Poker ist in vielen Teams Standard, weil es Diskussion und Beteiligung fördert:
Ablauf:
- Product Owner stellt die Story vor (Ziel, Akzeptanzkriterien).
- Team klärt Verständnisfragen.
- Jeder wählt verdeckt eine Karte (Story Point aus der Skala).
- Alle decken gleichzeitig auf.
- Bei großen Abweichungen erklären Extremwerte ihre Sicht.
- Zweite Abstimmung.
- Wert festlegen, sobald Konsens oder pragmatische Einigung erreicht ist.
Tipps:
- Zeitbox je Story (z. B. max. 5 Minuten).
- Stories mit massiv abweichenden Schätzungen markieren und ggf. neu schneiden.
- Diskussion auf Verständnis und Risiken fokussieren, nicht auf „Recht haben“.
Schritt 6: Team-Velocity empirisch aufbauen
Velocity ist der Durchschnitt der in einem Sprint erledigten Story Points.
Vorgehen:
- Die ersten 3–5 Sprints bewusst als Kalibrierung sehen.
- Velocity jedes Sprints retrospektiv festhalten:
- geplante Punkte
- tatsächlich abgeschlossene Punkte (Definition of Done erfüllt)
- Durchschnitt berechnen, z. B. Mittel aus den letzten 3 Sprints.
- Diese Zahl nur (!) intern nutzen, um künftige Sprints zu planen.
Wichtig:
- Velocity ist eine Folgegröße, kein Ziel.
- Kein Zielwert wie „Wir müssen auf 60 Punkte pro Sprint kommen“ definieren.
5. Typische Fehler beim Schätzen mit Story Points – und wie Sie sie vermeiden
Im Alltag wiederholen sich bestimmte Muster. Wenn Sie diese kennen, können Sie bewusst gegensteuern.
5.1 Anforderungen zu unklar – aber trotzdem schätzen
Symptome:
- Viele Fragen im Planning
- Diskussionen im Kreis
- Häufige Nacharbeiten im Sprint
Risiko:
- Schätzungen basieren auf Vermutungen.
- Stories „explodieren“ im Sprint.
Was tun?
- Stories mit hohem Unsicherheitsgrad als Spike oder Exploration markieren.
- Erst eine kleine Explorations-Story (z. B. 3 Punkte) umsetzen, Erkenntnisse dokumentieren, dann eigentliche Umsetzung schätzen.
- Product Owner verpflichtet sich, unklare Stories nicht in den nächsten Sprint zu ziehen.
5.2 Stories zu groß lassen
Epics oder „Monster-Stories“ mit 20+ Punkten sind ein Warnsignal.
Probleme:
- Blockieren den Sprint.
- Erschweren Fortschrittsmessung.
- Erhöhen Risiko und Unsicherheit.
Regel:
- Alles über 13 Punkten muss in kleinere Stories geschnitten werden.
- Ziel: Stories so schneiden, dass sie innerhalb eines Sprints sicher abschließbar sind.
Praktische Splitting-Ansätze:
- nach Use Cases / Varianten
- nach Schnittstellen / Komponenten
- nach fachlichen Domänen
- nach technischen Schritten (z. B. Backend, Frontend, Migration – mit Vorsicht)
5.3 Management misst Teams an Velocity
Wenn Velocity zum Zielwert wird, gehen die Probleme los:
- Teams erhöhen Schätzwerte.
- Schätzungen werden politisch.
- Prognose-Qualität sinkt.
Gegenmaßnahmen:
- Klar kommunizieren: Velocity dient nur zur Selbstplanung des Teams.
- Für Management andere Metriken etablieren:
- Time-to-Market
- Durchlaufzeit (Lead/Cycle Time)
- Business-Outcomes (z. B. Features, die tatsächlich genutzt werden)
5.4 Individuelle Leistung aus Story Points ableiten
Versuchskonstruktionen wie:
- „Entwickler X macht nur 10 Punkte pro Sprint, Entwickler Y 20 Punkte.“
sind fachlich unsauber:
- Story Points sind Teammaß.
- Contribution variiert nach Art der Aufgabe, nicht nur nach „Menge“.
- Viele Beiträge (Refinements, Reviews, Pairing, Coaching) sind nicht direkt in Story Points abbildbar.
Besser:
- Individuelles Feedback über Qualität der Zusammenarbeit, Kommunikation, Ownership.
- Teamleistung über erreichte Sprintziele und Wertbeitrag bewerten, nicht über Story Points.
5.5 Schätzaufwand explodiert
Manche Teams „ersticken“ im Estimation-Ritual:
- halbtägige Planning-Marathons
- Detaildiskussionen über jede Kleinigkeit
- ständige Re-Schätzungen
Konsequenz:
- Frustration im Team
- Wertschöpfung leidet
- Akzeptanz von Story Points sinkt
Empfehlungen:
- Refinement-Meetings (Backlog Grooming) nutzen, um Stories vor dem Planning zu klären.
- Nur Stories für die nächsten 1–2 Sprints vollständig schätzen.
- Kleinst-Stories (z. B. 0,5–1 Punkt) bei Reife des Teams auch mal pauschal behandeln (z. B. alles offensichtlich Kleine = 1 Punkt).
6. Praxisleitfaden: So verbessern Sie Ihre Story-Point-Schätzungen kontinuierlich
Gute Schätzung ist keine einmalige Aktion, sondern ein Lernprozess.
6.1 Schätz-Review in der Retrospektive
Nehmen Sie regelmäßig 1–2 Stories aus dem letzten Sprint in die Retrospektive:
- Welche Stories waren deutlich über- oder unterschätzt?
- Welche Annahmen lagen daneben?
- Was hätte uns vorher auffallen können?
Leitfragen:
- Haben wir Risiken übersehen?
- Waren Akzeptanzkriterien unklar?
- Haben wir Abhängigkeiten unterschätzt?
Ableitungen:
- Schärfung der Referenz-Stories
- Ergänzung der Schätz-Kriterien
- Anpassung der Definition of Ready
6.2 Definition of Ready (DoR) etablieren
Eine klare DoR verhindert Schätzungen ins Blaue hinein.
Mögliche Kriterien für „Story ist schätzbar“:
- Ziel und Business-Value sind beschrieben.
- Akzeptanzkriterien sind definiert.
- Abhängigkeiten sind benannt.
- Auswirkungen auf Architektur/IT sind grob verstanden.
- Story ist klein genug (z. B. Schätzung < 13 Punkte).
Stories, die diese Kriterien nicht erfüllen:
- werden nicht geschätzt
- kommen nicht in den nächsten Sprint
6.3 Story-Point-Kalibrierung als regelmäßigen Termin etablieren
Gerade in wachsenden oder wechselnden Teams ist es sinnvoll, alle 2–3 Monate eine Kalibrierungs-Session durchzuführen.
Vorgehen:
- 5–10 abgeschlossene Stories mit unterschiedlichem Aufwand auswählen.
- Ohne Blick auf die alten Werte neu schätzen lassen.
- Abweichungen besprechen:
- Hat sich unsere Wahrnehmung von „5 Punkten“ verändert?
- Müssen wir unser Referenz-Set anpassen?
Ziel:
- gemeinsames Mentalmodell stabilisieren
- neue Teammitglieder integrieren
6.4 Von Story Points zu belastbaren Forecasts
Viele Entscheider fragen: „Wann ist Feature X fertig?“ oder „Wie viele Sprints brauchen wir für dieses Produkt?“
Pragmatischer Ansatz:
- Gesamtumfang grob in Story Points schätzen (Epics in Stories herunterbrechen, aufsummieren).
- Mit der durchschnittlichen Velocity des Teams kombinieren:
- Beispiel: 200 Story Points Gesamtumfang, durchschnittlich 40 Story Points pro Sprint → grob 5 Sprints.
- Unsicherheit transparent machen:
- Best-Case / Worst-Case-Spanne (z. B. basierend auf min./max. Velocity der letzten Sprints).
- Regelmäßig nachsteuern:
- Wenn Stories präziser werden oder neue Erkenntnisse auftauchen, Umfang aktualisieren.
7. Story Points in gemischten Umgebungen (IT, Fachbereich, Dienstleister)
In der Praxis arbeiten häufig mehrere Parteien zusammen:
- internes IT-Team
- Fachbereich
- externe Dienstleister
Besonders hier entstehen Missverständnisse.
7.1 Erwartungsmanagement mit dem Business
Maßnahmen:
- Früh und klar erklären:
- Story Points sind keine Stunden.
- Schätzungen beinhalten auch Risiken und Komplexität.
- Visualisieren, wie aus Story Points realistische Roadmaps entstehen:
- Beispiel-Charts zur Velocity-Entwicklung
- Forecast-Beispiele mit Spannen
Empfehlung:
- Fachbereiche in Refinements teilweise einbeziehen, damit sie den Aufwand und die Diskussionen sehen.
7.2 Zusammenarbeit mit Dienstleistern
Häufige Stolpersteine:
- Dienstleister schätzen in Story Points, werden aber nach Zeit und Material abgerechnet.
- Auftraggeber erwarten „harte Zusagen“:
- „100 Story Points = 50 Personentage“
Was funktioniert besser?
- Entweder:
- Auf Zeitbasis vertraglich arbeiten und Story Points rein intern als Planungswerkzeug nutzen.
- Oder:
- Zusammen mit dem Dienstleister ein gemeinsames Verständnis von Story Points aufbauen, z. B. an gemeinsamen Referenz-Stories.
- Fixe Zeitbudgets mit flexibler Inhaltsschärfung kombinieren („Scope-boxing“ statt „Time-boxing“ einzelner Stories).
Wichtig:
Story Points sollten nicht zur versteckten Tagessatz-Verhandlung werden.
8. Praktische Checklisten: Sind Ihre Story Points gesund?
8.1 Schnell-Check für Teams
Beantworten Sie für Ihr Team:
- Nutzen wir Story Points primär für:
- Sprintplanung?
- Release-Planung?
- Prognosen mit Unsicherheitskommunikation?
- Oder eher für:
- Teamvergleiche?
- individuelle Leistungsbewertung?
- Management-Reports?
Wenn B: Alarmzeichen. Hier sollten Sie ansetzen.
8.2 Diagnose typischer Probleme
Problem: Sprints reißen regelmäßig die gesetzten Ziele.
Mögliche Ursachen:
- Stories zu groß oder zu unklar.
- Unterschätzte Abhängigkeiten.
- Eingriffe von außen (Ad-hoc-Tasks).
Ansätze:
- DoR schärfen.
- Puffer für ungeplante Themen vorsehen.
- Historische Velocity realistischer zur Planung nutzen.
Problem: Schätzen dauert ewig.
Mögliche Ursachen:
- Stories nicht vorbereitet.
- Diskussion driftet in technische Detail-Designs ab.
- Kein gemeinsames Verständnis der Skala.
Ansätze:
- Refinement verbessern, klare Timeboxen.
- Technik-Diskussionen in separate Architektur-Sessions auslagern.
- Referenz-Stories sichtbar machen (z. B. im Planning auf zweitem Bildschirm).
Problem: Story Points werden „immer größer“.
Mögliche Ursachen:
- Latenter Leistungsdruck.
- Velocity wird als Metrik nach oben gemeldet.
- Neue Teammitglieder schätzen anders.
Ansätze:
- Klarstellen, dass Velocity kein KPI ist.
- Kalibrierungs-Sessions einführen.
- Offen über Druck und Erwartungshaltung sprechen.
9. Konkreter Implementierungsplan für Ihr Unternehmen
Wenn Sie Story Points neu einführen oder „entgiften“ wollen, können Sie folgendermaßen vorgehen:
Woche 1–2: Analyse und Zielsetzung
- Interviews mit:
- Product Ownern
- Team Leads
- Management
- Fragen:
- Wofür nutzen wir heute Story Points?
- Wo entstehen Konflikte?
- Welche Entscheidungen sollen in Zukunft besser werden?
Ergebnis: Gemeinsames Zielbild, Entscheid über „Do’s & Don’ts“.
Woche 2–3: Rahmen setzen
- Schulungs-Workshop für:
- Grundlagen Story Points
- Anti-Pattern (Velocity als KPI, Stunden-Umrechnung)
- Best Practices
- Erarbeiten und dokumentieren:
- Referenz-Stories
- Bewertungskriterien
- Skala
- Definition of Ready
Woche 3–6: Pilotierung mit 1–2 Teams
- In ausgewählten Teams:
- neue Schätzpraxis in Refinement und Planning umsetzen
- Schätz-Review in Retrospektiven etablieren
- Management auf Trendbeobachtung einschwören, nicht auf Einzelwerte.
Ab Woche 6: Skalierung und Feintuning
- Erfahrungen der Pilotteams aufnehmen.
- Vorgehen für weitere Teams anpassen.
- Guidelines im Intranet/Wiki veröffentlichen.
- ggf. interne Community of Practice „Agile Schätzung“ aufbauen.
10. Fazit: Story Points als wirksames Werkzeug – nicht als Selbstzweck
Richtig eingesetzt, helfen Story Points Ihnen und Ihrem Team, …
- besser einzuschätzen, was in einen Sprint passt
- Risiken früh zu erkennen
- Vertrauen in Prognosen zu erhöhen
- Diskussionen von Schuld und Rechtfertigung weg hin zu Transparenz und Lernen zu verschieben
Sie sind jedoch kein Allheilmittel. Entscheidend ist:
- saubere Einführung
- klare Kommunikation mit Stakeholdern
- konsequentes Vermeiden typischer Fehlanreize
Wenn Sie das beherzigen, werden Story Points von der Quelle ständiger Diskussionen zu einem leisen, aber wirksamen Planungswerkzeug.
Wenn Sie Story Points unternehmensweit sauber etablieren oder in bestehenden Teams „entwirren“ möchten, lohnt sich oft ein externer Blick. Eine strukturierte Analyse Ihrer aktuellen Schätzpraxis, begleitet von 1–2 fokussierten Workshops, klärt typische Missverständnisse schnell und schafft ein gemeinsames Verständnis. Die PURE Consultant unterstützt Sie dabei auf Wunsch mit praxisnaher Beratung, die sich an Ihren Prozessen, Teams und Entscheidungswegen orientiert – von der ersten Bestandsaufnahme bis zur nachhaltigen Verankerung in Ihrem Projektportfolio.