Der Fall des verschwundenen p-Werts

Nr. 44

Der Fall des verschwundenen p-Werts

Ich saß wie immer in meinem Zimmer in London. Der Kamin knisterte, der Tee war zu stark, und mein Bruder Sherlock Holmes war vermutlich gerade dabei, einen Fußabdruck zu romantisieren. 🙄☕️ Ich hingegen dachte über echte Verbrechen nach. Nicht über Messer und Masken. Sondern über das, was viel raffinierter ist: Sätze, die sich als Fakten verkleiden. 📄🎭

Gerade als ich mich fragte, wie man Menschen dazu bringt, aus „nichts“ ein „WOW!“ zu machen, klopfte es. Dreimal. Zögerlich. Wie ein Reviewer, der weiß, dass er gleich jemanden weinen lässt. Ein Bote brachte mir einen Umschlag. Darauf stand nur: „Primärer Endpunkt verfehlt. Trotzdem ein grosser Triumph der klinischen Studie. Bitte schauen Sie auf das Studienmanuskript.“
Ich lächelte. „Ah“, murmelte ich. „Ein Klassiker. Der Täter heißt hier: Spin.“ 🕵️‍♂️🌀


Tatort: Der Abstract – die Fußgängerzone der Wissenschaft


Ich öffnete das beigefügte Manuskript. Schon die Überschrift klang, als hätte jemand Konfetti in die Statistikmaschine geworfen. Im folgenden Abstract stand dann auch:

  • „klinisch relevant“
  • „vielversprechend“
  • „könnte ein Gamechanger sein“ (ich zuckte sichtbar)
  • „günstiges Sicherheitsprofil“
  • und mein persönlicher Liebling: „trend towards improvement“

Ich blätterte weiter. Und da war er. Der Satz, der alles verrät wie Tabakasche auf frisch gewischtem Parkett: Der primäre Endpunkt wurde nicht erreicht.
Ich legte das Papier hin, als hätte es mir gerade ins Gesicht gelogen. „Also“, sagte ich in den Raum hinein, „wir haben eine Verurteilung des Angeklagten… aber trotzdem eine Siegesrede des Anwalts. Das ist nicht nur kreatives Schreiben. Das ist ein Delikt.“


Die Verdächtigen: Drei elegante Trickbetrüger


Ich kenne diese Bande. Sie ist berüchtigt. Und sie trägt immer dieselben Parfums: Hoffnung, Dringlichkeit und „Bitte zitieren“.


Verdächtiger Nr. 1: Sir Sekundärendpunkt: Er steht geschniegelt in der Ecke und sagt: „Ja gut, der Hauptgewinn war leer… aber schau mal, ich hab drei Trostpreise, die alle statistisch signifikant sind !“


Verdächtige Nr. 2: Lady Subgruppe: Sie flüstert: „Bei Linkshänderinnen mit grünen Socken in der ersten Jahreshälfte geboren hat’s aber super funktioniert.“ Und alle im Raum nicken, weil niemand zugeben will, dass das gerade ziemlich schräg klingt.


Verdächtiger Nr. 3: Captain Post-hoc: Er kommt erst nach der Party und sagt: „Ich hatte da noch eine Idee…“ Und plötzlich wird aus einer wissenschaftlichen Analyse ein komplettes Improvisationstheater.


Das Motiv: Dein Gehirn liebt Geschichten


Hier wird es neurodetektivisch köstlich. Denn das Problem ist nicht nur der Fachartikel. Das Problem ist dein Kopf und meiner übrigens auch. Unser Gehirn hat ein paar charmante Macken:

  • Es liebt Kohärenz: Eine gute Story fühlt sich wahr an.
  • Es liebt Belohnung: „Vielleicht wirkt es doch!“ Dopamin klatscht.
  • Es hasst Enttäuschung: „Hat nicht funktioniert“ klingt wie Regen im Urlaub.

Und genau hier setzt der Spin an: Er nimmt ein nüchternes Ergebnis und legt eine warme kuschelige Decke drüber. Nicht grob. Nicht offensichtlich. Sondern elegant, mit viel Tricks; so elegant, dass selbst kluge Menschen plötzlich sagen: „Na also! Klingt doch viel besser!“ Ich nenne das: kognitive Hypnose im Paper-Format.


Die Verfolgung: Ich betrete den Subgruppen-Salon


Ich ging im Manuskript dahin, wo die Lichter gedimmt sind: in die Diskussion. Dort stand ein Absatz wie ein Verkäufer in einem viel zu teuren Anzug: „Obwohl der primäre Endpunkt nicht erreicht wurde, sprechen die konsistenten Signale in mehreren sekundären Parametern…“
Ich hob eine Augenbraue. „Konsistent?“ fragte ich leise. „Oder nur… zufällig hübsch sortiert?“
Ich zog mein Notizbuch heraus, mein zuverlässiges Werkzeug: die präfrontale Taschenlampe. Damit leuchte ich dahin, wo die Story gern Schatten macht:

  • War der primäre Endpunkt vorher festgelegt?
  • Wurde an vielen Endpunkten herumprobiert?
  • Wie groß ist der Effekt wirklich und wie sicher ist er?
  • Sind die ‘positiven’ Ergebnisse klinisch bedeutsam oder nur statistisch dekorativ?

Die Autoren hatten überall kleine Glanzpunkte verteilt, wie Kerzen in einer dunklen Kirche. Doch ich suche nicht nach wissenschaftlicher Atmosphäre. Ich suchte nach Beweisen, unerschütterlichen Fakten.

Und da entdeckte ich die Spur: Ein sekundärer Endpunkt war „signifikant“, aber die Studie hatte so viele getestet, dass ich fast hörte, wie der Zufall kicherte. „Aha“, sagte ich. „Der Täter war nicht eine Lüge. Der Täter war… Selektionsromantik.“


Der Spin klaut nicht nur Wahrheit; er klaut Entscheidungen


Jetzt kommt der Teil, bei dem selbst mein Bruder kurz still wäre (nur kurz, versteht sich). Denn wenn Spin gelingt, passiert Folgendes:


  • Ein Arzt liest das Abstract zwischen Tür und Angel.
  • Eine Patientin fragt hoffnungsvoll nach „dem neuen Durchbruch“.
  • Eine Klinik diskutiert Off-Label-Einsatz.
  • Und plötzlich bewegt sich Medizin nicht wegen Evidenz, sondern wegen Erzählkraft.

Spin ist kein literarisches Problem. Spin ist ein klinisches Risiko. Er ist das Glitzern auf dem Wasser, das dich vergessen lässt, wie tief es ist.


Die Auflösung: Ich verhöre den primären Endpunkt


Ich ging zurück zum Anfang. Immer zurück zum Anfang. Denn gute Fälle lösen sich nicht in der Diskussion. Sie lösen sich in der Frage: Was wurde versprochen und wurde es gehalten?
Der primäre Endpunkt saß da wie ein unscheinbarer Zeuge, den niemand interviewen will. Ich setzte mich ihm gegenüber, lächelte freundlich und fragte: „Hast du gewonnen?“ Er schüttelte den Kopf. „Und warum dann jubeln alle?“
Er zuckte mit den Schultern. So sind Zeugen. Sie sagen die Wahrheit, aber sie dekorieren sie nicht. Ich stand auf. Fall gelöst. „Der Täter“, sagte ich, „ist nicht unbedingt böse. Oft ist er nur… ambitioniert. Und sein Komplize ist unser Gehirn, das lieber Hoffnung trinkt als Unsicherheit.“


Mein persönlicher Spin-Detektor für dich


Wenn du das nächste Mal so ein „fast genial“-Paper siehst, mache Folgendes:

  1. Frage zuerst nach dem primären Endpunkt. Nicht nach dem schönsten Satz.
  2. Lass dich nicht von Sekundärendpunkten verführen. Sie sind Hinweise, keine Urteile.
  3. Misstraue Subgruppen wie einem Grafen mit Monokel. Hübsch, aber selten zuverlässig.
  4. Schau auf Effektgröße und Unsicherheit. Nicht nur: „Ist es signifikant?“ sondern: „Ist es sinnvoll?“
  5. Wenn das Fazit euphorischer ist als die Ergebnisse, riecht es nach Parfum.
  6. Und Parfum ist selten Evidenz.


Epilog: Ein leiser Erfolg


Später saß ich wieder in meinem Zimmer in London, die Kerze klein, der Tee unvernünftig stark. Und ich dachte über den Täter nach, der heute so leise war, dass ihn viele gar nicht als Täter erkennen.


Spin ist kein plumper Betrug mit falschen Zahlen. Spin ist viel raffinierter: Es ist die Kunst, ein „Nicht-Ergebnis“ so zu frisieren, dass es sich anfühlt wie ein „Fast-Erfolg“. Man nimmt einen primären Endpunkt, der nicht signifikant ist, legt ihn höflich auf ein Sofa (mit Kissen), und zeigt dem Publikum stattdessen die hübsch beleuchtete Vitrine mit Sekundärendpunkten, Subgruppen oder „Trends“. Nicht gelogen, aber dramaturgisch umdekoriert. Wie ein Zaubertrick, bei dem die Münze nicht verschwindet, sondern nur sehr geschickt in der Tasche landet.
Und das ist nicht nur meine Londoner Kamin-Philosophie: Ich habe kürzlich ein Paper gelesen, das genau dieses Muster in MS-Studien untersucht hat und zwar in Arbeiten, bei denen der primäre Endpunkt nicht erreicht wurde. Ergebnis: Spin tauchte in mehr als jeder zweiten Publikation auf.


Mit anderen Worten: Selbst wenn der Hauptschlüssel nicht ins Schloss passt, wird manchmal so charmant am Türknauf gerüttelt, dass es klingt, als sei man schon drin. Warum funktioniert das? Weil unser Gehirn Geschichten liebt. „Vielleicht wirkt’s doch!“ ist für die grauen Zellen wie Kino mit Popcorn. „Hat nicht geklappt“ hingegen ist wie ein Lehrbuchkapitel ohne Bilder.
Ich blies die Kerze fast aus, hielt kurz inne und grinste. „Spin“, murmelte ich, „ist die Schminke über Evidenz die Nichtwirksamkeit. Und meine Aufgabe ist nicht, sie zu verbieten… sondern sie im Halbdunkel zu erkennen.“

Referenz