Der Zufallsfaktor und das Gesetz der großen Zahl

Die Glaubwürdigkeit der Erkenntnisse (Evidenz) über Therapieeffekte beruht auf der Vermeidung von systematischen Fehlern – und dem richtigen Umgang mit den Fehlern, die nicht verhindert werden konnten. Wenn diese Eigenschaften fairer Tests nicht gewährleistet sind, dann kann auch keinerlei angemessene Bearbeitung der Forschungsdaten die verbleibenden Probleme mit ihren gefährlichen – und gelegentlich auch tödlichen – Folgen lösen (s. Kap. 1 und 2). Und selbst wenn die zur Minderung von Bias unternommenen Schritte erfolgreich sind, besteht immer noch die Möglichkeit, dass der Zufall uns in die Irre führt.

Wie wir alle wissen, kommt es beim Münzenwerfen nicht selten vor, dass man nacheinander fünfmal oder noch öfter ganze Serien von Kopf oder Zahl wirft. Und wie wir ebenfalls wissen: Je öfter man eine Münze wirft, umso wahrscheinlicher ist es, dass am Ende gleich oft Kopf und Zahl geworfen wurden.

Wenn zwei Therapien verglichen werden, dann können etwaige Unterschiede in den Ergebnissen auch einfach auf einem solchen Zufall beruhen. Nehmen wir einmal an, 40 % der Patienten versterben, nachdem sie Therapie A erhalten haben, während in der Vergleichsgruppe nach Anwendung von Therapie B 60 % versterben. Tabelle 1 zeigt, was man erwarten würde, wenn jeweils zehn Patienten eine der beiden Therapien erhielten. Der Unterschied in der Anzahl der Todesfälle zwischen den beiden Therapien wird als «Risikoverhältnis » (engl. risk ratio) ausgedrückt. Das Risikoverhältnis in diesem Beispiel liegt bei 0,67.

Therapie A Therapie B Risikoverhältnis (A : B = )
Anzahl der Verstorbenen 4 6 (4 : 6 = 0,67)
von (insgesamt) 10 10
Tabelle 1: Liefert diese kleine Studie einen zuverlässigen Schätzwert für den Unterschied zwischen Therapie A und Therapie B?

Wäre es sinnvoll, auf der Grundlage dieser niedrigen Teilnehmerzahlen den Schluss zu ziehen, dass Therapie A besser ist als Therapie B? Wahrscheinlich nicht. Es könnte purer Zufall sein, dass es einigen Patienten in der einen Gruppe besser ging als in der anderen Gruppe. Wenn man den Vergleich in anderen kleinen Gruppen von Patienten wiederholen würde, könnten sich die Zahlen der in jeder Gruppe verstorbenen Personen umkehren (6 zu 4) oder gleich groß sein (5 zu 5). Rein zufällig könnte sich aber auch ein ganz anderes Verhältnis ergeben.

Was aber würden Sie erwarten, wenn in jeder Behandlungsgruppe genau derselbe Anteil von Patienten (40 % und 60 %) verstorben wäre, nachdem jeweils 100 Patienten eine der beiden Therapien erhalten hätten (Tab. 2)? Auch wenn das Unterschiedsmaß (das Risikoverhältnis) exakt dasselbe ist (nämlich 0,67) wie bei dem Vergleich in Tabelle 1, so ist der Unterschied zwischen 40 Todesfällen auf der einen und 60 Todesfällen auf der anderen Seite doch eindrucksvoller als der Unterschied zwischen 4 und 6 Todesfällen. Damit ist auch die Wahrscheinlichkeit geringer, dass hier nur Zufall im Spiel ist. Um also zu vermeiden, dass wir uns in Therapievergleichen vom Zufallsfaktor täuschen lassen, müssen wir unsere Schlussfolgerungen auf die Untersuchung einer ausreichend großen Anzahl von Patienten stützen, die versterben können oder deren Zustand sich verschlechtern oder bessern oder unverändert bleiben kann. In diesem Fall spricht man manchmal vom «Gesetz der großen Zahl».

Tabelle 2: Liefert diese mittelgroße Studie einen zuverlässigen Schätzwert für den Unterschied zwischen Therapie A und Therapie B?
Therapie A Therapie B Risikoverhältnis (A : B = )
Anzahl der Verstorbenen 40 60 (40 : 60 = 0,67)
von (insgesamt) 100 100