Statistisches Vertrauen
.webp)
Das Maß an Sicherheit, das man bei den Ergebnissen eines statistischen Tests hat. Sie wird normalerweise als Prozentsatz ausgedrückt, z. B. 95 %, was bedeutet, dass 95 % der Tests zum gleichen Ergebnis führen würden, wenn man den Test unter denselben Bedingungen viele Male wiederholen würde. Dies ist ein zentraler Begriff in der frequentistischen Analyse, die in den meisten herkömmlichen A/B-Testing-Tools verwendet wird.
Im frequentialistischen Ansatz :
- Statistisches Vertrauen ist mit der Wahrscheinlichkeit verbunden , dass die Nullhypothese fälschlicherweise zurückgewiesen wird (Fehlerrisiko Typ I).
- Ein Vertrauensniveau von 95% entspricht einer Signifikanzschwelle (p-Wert) von 0,05.
- Dies bedeutet, dass man eine maximal 5%ige Chance akzeptiert , dass der beobachtete Unterschied zufällig ist.
Beispiel: Wenn Variation B eine statistische Sicherheit von 96 % hat, wird davon ausgegangen, dass sie Version A mit einer Fehlerspanne von weniger als 4 % signifikant übertrifft.
Im bayesianischen Ansatz :
- Stattdessen spricht man von der Wahrscheinlichkeit, dass eine Variation besser ist als die andere (z. B.: "Variation B ist mit 92 % Wahrscheinlichkeit besser als A").
- Es handelt sich nicht um einen Ablehnungstest, sondern um eine direkte Schätzung der Wahrscheinlichkeit eines tatsächlichen Gewinns.
- Dieser Ansatz ist für Fachteams oft intuitiver, hängt aber stärker von den Priors (Ausgangsannahmen) ab.
In CRO :
Unabhängig davon, welchen Rahmen Sie wählen, ist statistisches Vertrauen entscheidend für :
- die Ergebnisse eines A/B-Tests validieren,
- falsch positive Ergebnisse (Zufallseffekte) begrenzen,
- fundierte Entscheidungen auf der Grundlage zuverlässiger Daten treffen.
Achtung: Eine hohe statistische Sicherheit ist keine Garantie für eine signifikante geschäftliche Auswirkung. Sie muss mit anderen Indikatoren (Uplift, Stichprobengröße, Inkrementalwert) gekreuzt werden, um eine Entscheidung über die Implementierung zu leiten.