Erster Freitagsfüller im neuen Jahr

1.  In diesem Jahr möchte ich meine Ausbildung zur Rettungsassistin schaffen. 2. Bisher zweifle ich noch etwas, ob ich schaffe das. 3.  Es könnte sein, dass ich in meinen Hauptjob bald durchdrehe, denn die Statistik, die wir hier machen müssen, ist sehr bescheuert. 4.  Der Winter fällt dies Jahr anscheinend übrigens aus (ich mag doch den Schnee so gerne, menno) . 5. Moment, warte mal, ist heute überhaupt Freitag (bin mit den ganzen Feiertagen und Ereignissen echt etwas durcheinander). 6.   Die Hochwasserkatastrophe mit meinen eigenen Erlebnissen im Einsatz wird mir von 2013 in Erinnerung bleiben. 7. Was das Wochenende angeht, heute Abend freue ich mich […]

Adventskalender – 19. Türchen

Heute geht es im Adventskalender um Mathematik, genauer gesagt, um bedingte Wahrscheinlichkeiten. Thema ist das Monty-Hall-Problem, im deutschen Sprachraum auch als Ziegenproblem bekannt. Die Lösung überrascht zuerst, ist aber bei längerem Nachdenken sehr einsichtig. Es heißt nicht umsonst bedingte Wahrscheinlichkeit. Erstaunlicherweise gibt es mehr als genug Leute, die an dieser simplen Überlegung scheitern: Hier geht’s zu allen anderen Türchen des Adventskalenders

Statistische Signifikanz (p-Wert) in Studien (mit Simulator)

Was bedeutet signifikant? Was bedeutet statistisch signifikant? Was bedeutend der statistische p-Wert? Warum wird der p-Wert eingesetzt?

Statistik ist ein wesentlicher Teil empirischer, wissenschaftlicher Studien. Kenntnisse in Statistik sind notwendig.

Ich hatte einmal etwas Statistik, doch das ist schon länger her. Zur Auffrischung und zum Erklären habe ich diesen Artikel mit einem kleinen Statistik-Simulator geschrieben. Der Simulator soll zum Ausprobieren animieren. Beim Artikel stand nicht die mathematische Präzision im Vordergrund, sondern das intuitive Verständnis.

Die mathematischen Symbole und der Simulator werden dynamischen (mit JavaScript) erstellt. Aus diesem Grund wird der Artikel in RSS-Feeds und versandten E-Mails nicht vollständig angezeigt und ausführbar sein. Der Simulator funktioniert im Web-Browser.

Münz-Beispiel

Der Simulator stellt ein kleines Beispiel dar. Wir simulieren eine Münze. $0$ ist Kopf. $1$ ist Zahl. Die Stichprobe (Beobachtung, Datenerhebung) besteht aus $n$ Würfen.

Wir können uns nun fragen, ob die Münze fair ist, ob Kopf und Zahl gleich wahrscheinlich sind oder ob eine der beiden Seiten wahrscheinlicher ist. Ähnlich der Frage, ob Behandlungserfolge zufällig sind oder auf die Wirkung der Behandlung zurückgehen.

Statistische Tests

Bei Stichproben aus Datenerhebungen stellt sich die Frage, ob die Stichprobe «ein Muster» zeigt oder, ob die Stichprobe im Rahmen des Zufalls ist. Um diese Frage zu beantworten gibt es statistische Tests. Je nach Problemfeld und erhobenen Daten kommen verschiedene Tests zum Einsatz.

Mathematik ist eine Sprache und ein Werkzeug. Um das Problem statistisch bearbeiten zu können, müssen wir es übersetzen. Um die spätere Bearbeitung zu erleichtern wird es in eine bestimmte Form gebracht.

Die zu überprüfende Hypothese, dass Kopf und Zahl gleich wahrscheinlich sind, wird als Nullhypothese $H_0$ bezeichnet. Die gegenteilige Hypothese wird als Alternativhypothese $H_1$ bezeichnet.

$H_0$: Die Wahrscheinlichkeit $p$ für Kopf ist gleich der Wahrscheinlichkeit für Zahl, oder formal $p = 1/2$.

$H_1$: Die Wahrscheinlichkeiten sind unterschiedlich. Es gilt also: $p \ne 1/2$.

Ja/Nein, $0/1$ Experimente sind binominalverteilt. Sie gehorchen der Binominalverteilung.

Im statistischen Test wird nun geprüft wie wahrscheinlich eine Stichprobe bei einer Binominalverteilung ist. Es wird der p-Wert der Stichprobe bestimmt. Ein zuvor festgelegter Signifikanzschwellwert $\alpha$, typischerweise $0.05$, sagt ab welchem p-Wert die Nullhypothese verworfen wird. Falls die Wahrscheinlichkeit der Stichprobe kleiner als dieser Signifikanzschwellwert ist, wird die Nullhypothese verworfen und die Alternativhypothese angenommen.

Kompakter geschrieben:

$H_0$: $p = p_0$

$H_1$: $p \ne p_0$ (bei zweiseitiger Fragestellung)

Unter der Nullhypothese ist die Stichprobe binomialverteilt mit dem Erwartungswert $n p_0$.

Es gibt verschiedene statistische Tests um binominalverteilte Stichproben zu prüfen.

  • Binominaltest für eine Stichprobe
    • Binominaltestnäherung für eine hinreichend grosse Stichprobengrösse
  • Chi2-Test für eine Stichprobe mit einem 2-fach gestuften Merkmal

Simulator

Ich habe für die oben beschriebenes Münzbeispiel einen Simulator geschrieben. $0$ ist Kopf, $1$ ist Zahl. $p_0$ ist die gegebene Wahrscheinlichkeit für Kopf. Diesen Wert wollen wir statistisch überprüfen. Im Simulator kann $p_0$ mit einem Schieberegler eingestellt werden.

Die Grösse einer Stichprobe kann mit dem Schieberegler $n$ eingestellt werden. Eine Stichprobe entspricht einem Experiment. Dies könnte in der Realität einer Studie entsprechen.

Im Simulator ist es leicht viele Wiederholungen des Experimentes zu machen und viele Stichproben auswerten zu können.

Mit dem Simulator kann gespielt und intuitiv ausprobiert werden.

Interessante Szenarien sind:

  • Wie viele falsche signifikante Ergebnisse gibt es? Wie häufig wird die Nullhypothese verworfen bei $p_0 = 1/2$, also eine fairer Münze, wo die Nullhypothese gilt? (Mit Parameter Anzahl Läufe $m$ spielen.)
    • Wie abhängig ist die Anzahl signifikanter Ergebnisse von der Stichprobengrösse? (Mit Parameter $n$ spielen, beispielsweise $n = 40$ oder $n = 100$.)
  • Wie unfair muss eine Münze sein, damit die Nullhypothese verworfen wird, also ein signifikantes Ergebnis erzielt wird. ($p_0$ auf $0.51$, $0.6$ und $0.7$ setzen). Wie aggressiv wird $H_0$ verworfen?
    • Gleichzeitig kann der Einfluss der Stichprobengrösse untersucht werden. (Mit Parameter $n$ spielen, beispielsweise $n = 40$ oder $100$.)

Viel Spass beim Simulieren!

Beobachtungen

Wir sehen, dass für eine recht unfaire Münze (Bsp. $p_0 = 0.66$) genügen schon wenige Stichproben (Bsp. $n = 20$), um eine statistisch zuverlässige Aussage mit tiefem p-Wert zu erhalten. (Kontrolle mit $m = 100$).

Umgekehrt kann für eine kleine Unfairness (Bsp. $p_0 = 0.51$) mit einer grossen Stichprobe (Bsp. $n = 1000$) ein signifikantes Ergebnis mit (p-Wert $

Die statistische Signifikanz sagt nichts über die Relevanz eines Ergebnisses. Die Signifikanz bzw. Relevanz kann nicht von der statistischen Signifikanz abgeleitet werden. Die statistische Signifikanz gibt nur eine Antwort, ob ein Resultat zufällig oder überzufällig ist.

Da es sich um ein mathematisches Modell handelt, könnte man sich für $0$ auch eine Geburt eines Knaben denken und für $1$ die Geburt eines Mädchens. Das wird mit diesem $0/1$ Modell genauso abgebildet. Gibt es statistisch mehr Geburten eines Geschlechts? Mehr Knaben, mehr Mädchen?

Literaturangaben

Für die Erstellung dieses Artikels habe ich Wikipedia (p-Wert, Binomialtest, Chi-Quadrat) und das Buch Basiswissen Medizinische Statistik, Christel Weiß, 5., überarbeitete Auflage. Springer, 2010 benutzt.

Quellcode

Im Sinne von Open Source ist hier der Simulator abrufbar: p-Wert 1 Stichproben Simulator.js

Als Statistik-Hilfsprogramm habe ich jstat verwendet. Die wunderschöne mathematische Darstellung erstelle ich mit MathJAX. Die Simulatorbenutzeroberfläche habe ich mit jQuery und jQuery UI gemacht.

Ausblick

Im vorliegenden Simulator habe ich den einfachst möglichen Simulator erstellt. Kopf/Zahl werden mit $0/1$ abgebildet. Das Prinzip kann demonstriert werden. Auf die Thematik von ein- und zweiseitigen Tests bin ich nicht eingegangen.

Der Simulator kann noch erweitert werden:

  1. Wie in klinischen Studien üblich, kann eine Kontrollgruppe (z.B. mit Placebo) einbezogen werden.
  2. Die Statistik einer echten, grossen Studie könnte nachgebildet und simuliert werden.1

Bei Zeit und Lust werde ich mich daran machen.

Fazit

Der p-Wert von statistischen Tests gibt an wie wahrscheinlich eine Stichprobe (Experiment, Versuch, …) unter Annahme einer Verteilung ist. Er zeigt, ob eine Stichprobe zufällig oder überzufällig ist. Die statistische Signifikanz sagt nichts über die (nicht-statistische) Signifikanz. In anderen Worten, die statistische Signifikanz sagt nicht wie relevant eine Ergebnis ist.


  1. Die Nachbildung einer echten wissenschaftlichen Studie ist möglich, da in der Wissenschaft die Methoden angegeben werden. Also auch, welche statistischen Verfahren benutzt wurden. 

Statistische Signifikanz (p-Wert) in Studien (mit Simulator)

Was bedeutet signifikant? Was bedeutet statistisch signifikant? Was bedeutend der statistische p-Wert? Warum wird der p-Wert eingesetzt?

Statistik ist ein wesentlicher Teil empirischer, wissenschaftlicher Studien. Kenntnisse in Statistik sind notwendig.

Ich hatte einmal etwas Statistik, doch das ist schon länger her. Zur Auffrischung und zum Erklären habe ich diesen Artikel mit einem kleinen Statistik-Simulator geschrieben. Der Simulator soll zum Ausprobieren animieren. Beim Artikel stand nicht die mathematische Präzision im Vordergrund, sondern das intuitive Verständnis.

Die mathematischen Symbole und der Simulator werden dynamischen (mit JavaScript) erstellt. Aus diesem Grund wird der Artikel in RSS-Feeds und versandten E-Mails nicht vollständig angezeigt und ausführbar sein. Der Simulator funktioniert im Web-Browser.

Münz-Beispiel

Der Simulator stellt ein kleines Beispiel dar. Wir simulieren eine Münze. $0$ ist Kopf. $1$ ist Zahl. Die Stichprobe (Beobachtung, Datenerhebung) besteht aus $n$ Würfen.

Wir können uns nun fragen, ob die Münze fair ist, ob Kopf und Zahl gleich wahrscheinlich sind oder ob eine der beiden Seiten wahrscheinlicher ist. Ähnlich der Frage, ob Behandlungserfolge zufällig sind oder auf die Wirkung der Behandlung zurückgehen.

Statistische Tests

Bei Stichproben aus Datenerhebungen stellt sich die Frage, ob die Stichprobe „ein Muster“ zeigt oder, ob die Stichprobe im Rahmen des Zufalls ist. Um diese Frage zu beantworten gibt es statistische Tests. Je nach Problemfeld und erhobenen Daten kommen verschiedene Tests zum Einsatz.

Mathematik ist eine Sprache und ein Werkzeug. Um das Problem statistisch bearbeiten zu können, müssen wir es übersetzen. Um die spätere Bearbeitung zu erleichtern wird es in eine bestimmte Form gebracht.

Die zu überprüfende Hypothese, dass Kopf und Zahl gleich wahrscheinlich sind, wird als Nullhypothese $H_0$ bezeichnet. Die gegenteilige Hypothese wird als Alternativhypothese $H_1$ bezeichnet.

$H_0$: Die Wahrscheinlichkeit $p$ für Kopf ist gleich der Wahrscheinlichkeit für Zahl, oder formal $p = 1/2$.

$H_1$: Die Wahrscheinlichkeiten sind unterschiedlich. Es gilt also: $p \ne 1/2$.

Ja/Nein, $0/1$ Experimente sind binominalverteilt. Sie gehorchen der Binominalverteilung.

Im statistischen Test wird nun geprüft wie wahrscheinlich eine Stichprobe bei einer Binominalverteilung ist. Es wird der p-Wert der Stichprobe bestimmt. Ein zuvor festgelegter Signifikanzschwellwert $\alpha$, typischerweise $0.05$, sagt ab welchem p-Wert die Nullhypothese verworfen wird. Falls die Wahrscheinlichkeit der Stichprobe kleiner als dieser Signifikanzschwellwert ist, wird die Nullhypothese verworfen und die Alternativhypothese angenommen.

Kompakter geschrieben:

$H_0$: $p = p_0$

$H_1$: $p \ne p_0$ (bei zweiseitiger Fragestellung)

Unter der Nullhypothese ist die Stichprobe binomialverteilt mit dem Erwartungswert $n p_0$.

Es gibt verschiedene statistische Tests um binominalverteilte Stichproben zu prüfen.

  • Binominaltest für eine Stichprobe
    • Binominaltestnäherung für eine hinreichend grosse Stichprobengrösse
  • Chi2-Test für eine Stichprobe mit einem 2-fach gestuften Merkmal

Simulator

Ich habe für die oben beschriebenes Münzbeispiel einen Simulator geschrieben. $0$ ist Kopf, $1$ ist Zahl. $p_0$ ist die gegebene Wahrscheinlichkeit für Kopf. Diesen Wert wollen wir statistisch überprüfen. Im Simulator kann $p_0$ mit einem Schieberegler eingestellt werden.

Die Grösse einer Stichprobe kann mit dem Schieberegler $n$ eingestellt werden. Eine Stichprobe entspricht einem Experiment. Dies könnte in der Realität einer Studie entsprechen.

Im Simulator ist es leicht viele Wiederholungen des Experimentes zu machen und viele Stichproben auswerten zu können.

Mit dem Simulator kann gespielt und intuitiv ausprobiert werden.

Interessante Szenarien sind:

  • Wie viele falsche signifikante Ergebnisse gibt es? Wie häufig wird die Nullhypothese verworfen bei $p_0 = 1/2$, also eine fairer Münze, wo die Nullhypothese gilt? (Mit Parameter Anzahl Läufe $m$ spielen.)
    • Wie abhängig ist die Anzahl signifikanter Ergebnisse von der Stichprobengrösse? (Mit Parameter $n$ spielen, beispielsweise $n = 40$ oder $n = 100$.)
  • Wie unfair muss eine Münze sein, damit die Nullhypothese verworfen wird, also ein signifikantes Ergebnis erzielt wird. ($p_0$ auf $0.51$, $0.6$ und $0.7$ setzen). Wie aggressiv wird $H_0$ verworfen?
    • Gleichzeitig kann der Einfluss der Stichprobengrösse untersucht werden. (Mit Parameter $n$ spielen, beispielsweise $n = 40$ oder $100$.)

Viel Spass beim Simulieren!

Beobachtungen

Wir sehen, dass für eine recht unfaire Münze (Bsp. $p_0 = 0.66$) genügen schon wenige Stichproben (Bsp. $n = 20$), um eine statistisch zuverlässige Aussage mit tiefem p-Wert zu erhalten. (Kontrolle mit $m = 100$).

Umgekehrt kann für eine kleine Unfairness (Bsp. $p_0 = 0.51$) mit einer grossen Stichprobe (Bsp. $n = 1000$) ein signifikantes Ergebnis mit (p-Wert $< 0.05$) erreicht werden. (Kontrolle mit $m = 100$).

Die statistische Signifikanz sagt nichts über die Relevanz eines Ergebnisses. Die Signifikanz bzw. Relevanz kann nicht von der statistischen Signifikanz abgeleitet werden. Die statistische Signifikanz gibt nur eine Antwort, ob ein Resultat zufällig oder überzufällig ist.

Da es sich um ein mathematisches Modell handelt, könnte man sich für $0$ auch eine Geburt eines Knaben denken und für $1$ die Geburt eines Mädchens. Das wird mit diesem $0/1$ Modell genauso abgebildet. Gibt es statistisch mehr Geburten eines Geschlechts? Mehr Knaben, mehr Mädchen?

Literaturangaben

Für die Erstellung dieses Artikels habe ich Wikipedia (p-Wert, Binomialtest, Chi-Quadrat) und das Buch Basiswissen Medizinische Statistik, Christel Weiß, 5., überarbeitete Auflage. Springer, 2010 benutzt.

Quellcode

Im Sinne von Open Source ist hier der Simulator abrufbar: p-Wert 1 Stichproben Simulator.js

Als Statistik-Hilfsprogramm habe ich jstat verwendet. Die wunderschöne mathematische Darstellung erstelle ich mit MathJAX. Die Simulatorbenutzeroberfläche habe ich mit jQuery und jQuery UI gemacht.

Ausblick

Im vorliegenden Simulator habe ich den einfachst möglichen Simulator erstellt. Kopf/Zahl werden mit $0/1$ abgebildet. Das Prinzip kann demonstriert werden. Auf die Thematik von ein- und zweiseitigen Tests bin ich nicht eingegangen.

Der Simulator kann noch erweitert werden:

  1. Wie in klinischen Studien üblich, kann eine Kontrollgruppe (z.B. mit Placebo) einbezogen werden.
  2. Die Statistik einer echten, grossen Studie könnte nachgebildet und simuliert werden.1

Bei Zeit und Lust werde ich mich daran machen.

Fazit

Der p-Wert von statistischen Tests gibt an wie wahrscheinlich eine Stichprobe (Experiment, Versuch, …) unter Annahme einer Verteilung ist. Er zeigt, ob eine Stichprobe zufällig oder überzufällig ist. Die statistische Signifikanz sagt nichts über die (nicht-statistische) Signifikanz. In anderen Worten, die statistische Signifikanz sagt nicht wie relevant eine Ergebnis ist.


  1. Die Nachbildung einer echten wissenschaftlichen Studie ist möglich, da in der Wissenschaft die Methoden angegeben werden. Also auch, welche statistischen Verfahren benutzt wurden. 

Evidenzbasierte Medizin (EBM) und Cochrane [akt.]

Was ist evidenzbasierte Medizin? Warum ist evidenzbasierte Medizin wichtig? Was ist Cochrane? Funktioniert evidenzbasierte Medizin?

Evidenzbasierte Medizin (EBM)

Evidenzbasierte Medizin (EBM) bezeichnet eine Medizin, die auf Fakten basiert. Medizinische Entscheidungen sollen sich am besten vorhandenen Wissen orientieren. Es ist nichts anderes als eine wissenschaftlich fundierte Medizin.

War das nicht schon immer so? Was ist daran neu?

Seit langem wird die Medizin an Universitäten gelehrt. Ist da nicht automatisch Wissenschaft drin? Nehmen wir das Beispiel des Aderlasses, lange der häufigste angewendete medizinische Eingriff. Die Doktoren hatten ein Säfte-Modell des Menschen im Kopf. Dort machte ein Aderlass Sinn. Doch wäre es irgend jemand in den Sinn gekommen dies nachzuprüfen, ob es überhaupt hilft? Leute, mit und ohne Aderlass, zu vergleichen? Nach über 200 Jahren wurde dies dann endlich gemacht und siehe da, der Aderlass schadete sogar.

Nicht die Theorie zählt, sondern das Resultat. Um Resultate vergleichen zu können, müssen diese gemessen werden. Da bei Resultaten immer auch der Zufall mitspielen kann, genügt eine Messung nicht, sondern man macht mehrere Wiederholungen. Und über die verschiedenen Resultate lassen sich dann statistisch auswerten. Dies tönt jetzt vielleicht einfach. Doch Messungen können aufwendig sein, man denke z.B. die Messung einer Depression. Es müssen auch genügend Versuchspersonen mitmachen. Kurz, Messungen können aufwändig sein. Kleinere Studien sind einfacher. Aus diesem Grund gibt es auch mehr kleinere Studien.

Die statistische Aussagekraft kleinerer Studien ist oft beschränkt. Man kann keine eindeutigen Schlüsse ziehen.

Doch warum nicht die vielen kleinen Studien zu einer grossen zusammennehmen? Wenn die Daten der kleinen Studien vorhanden sind, ist dies möglich. Es können alle Studien, ob gross oder klein gesucht werden und daraus kann eine sogenannte Metaanalyse erstellt werden. Genau, das macht die Cochrane Collaboration.

Cochrane Collaboration

Die Wissenschaftler von Cochrane machen systematische Übersichtsarbeiten und fassen diese statistisch zu einer Metaanalyse zusammen. Übersichtsarbeiten (Reviews) wurden schon lange erstellt, aber nicht systematisch. Forscher nahmen beispielsweise jene Studien, die ihre Thesen unterstützen. Cochrane hat sich darauf spezialisiert, alle vorhandenen Studien systematisch mit festgelegten und nachvollziehbaren Kriterien zusammenzuziehen und auszuwerten. Sie haben «Werkzeuge» (Methoden) geschaffen und wenden diese an.

Die Cochrane Collaboration wurde 1993 von Iain Chalmers mit weiteren in England gegründet. Der Name Cochrane wurde in Andenken an den Arzt und Epidemiologen Archie Cochrane (1909 – 1988) gewählt, einer der Begründer der evidenzbasierten Medizin. Die Cochrane Collaboration ist eine Non-Profit-Organisation. Interessenkonflikte werden ernst genommen. Die Cochrane Collaboration ist mittlerweile eine weltweit tätige Organisation, auch mit Ablegern in der Schweiz und Deutschland.

Iain Chalmers wurde für seine Arbeit von der Queen geadelt.

Blobbogramm, das Cochrane Collaboration Logo

Cochrane Collaboration Logo© Cochrane Collaboration

Das Logo der Cochrane Collaboration zeigt ein Blobbogramm. Ein Blobbogramm ist das Resultat einer Metaanalyse. Das Logo der Cochrane Collaboration zeigt das Blobbogramm aller Studien zur Abgabe von Hormonen (Steroide) bei Frühgeborenen zum Überleben. Jede horizontale Linie steht für eine Studie. Je weiter links die Linie, desto hilfreicher sind die Hormone gemäss dieser Studie. Die zentrale, vertikale Linie ist die «Linie ohne Effekt». Wenn eine horizontale Linie die Linie ohne Effekt berührt, dann zeigt diese Studie keinen statistische signifikanten Nutzen. Je länger eine horizontale Linie, desto grösser die Unsicherheit einer Studie. Das sind die kleinen Studien. Das kleine Viereck unten zeigt den Nutzen über alle Studien zusammen. Bei diesem konkreten Beispiel ist das Viereck weit von der Linie ohne Effekt entfernt. Die Abgabe von Steroiden bei Frühgeborenen ist hilfreich. Leben von Frühgeborenen werden gerettet.

Das erstaunliche ist, dass das Blobbogramm erst 1989 erfunden wurde. Die Fakten zur Abgabe von Hormonen bei Frühgeborenen waren schon lange vorhanden, doch keiner machte Metaanalyse. Niemand wusste wie effektiv sie sind. In Folge dessen wurden selten Hormone gegeben und viele Frühgeborene verstarben unnötigerweise. Nicht weil die Daten nicht vorhanden gewesen wären, sondern nur, weil keine gesamthafte Auswertung gemacht wurde.

Übersichtsarbeiten (Systematic Reviews)

Die Cochrane Collaboration stellt ihre Auswertungen als systematische Reviews zur Verfügung. Die Zusammenfassung kann jeder lesen. Dabei gibt es eine wissenschaftlich exakte Zusammenfassung und eine für Laien. Einige Zusammenfassungen gibt es auch auf deutsch. So wie sich das Wissen vergrössert, so werden die systemaischen Übersichtsarbeiten periodisch überarbeitet.

Probiert es aus!

Beispiel: Nutzen von Beta-Interferonen bei schubförmiger Multiple Sklerose

Die Zusammenfassung, Auswertung Stand 2009:

Multiple sclerosis (MS) is a chronic disease of the nervous system which affects young and middle-aged adults. Repeated damage to the myelin sheaths and other parts of the nerves can lead to serious disability. MS may be related to the immune system. Interferons have several effects on the immune system, and act against viruses. Interferons can help to reduce disability and attacks for people with multiple sclerosis, but there is not enough evidence about their usefulness in the long term. The review of trials found that interferons administered intramuscularly or subcutaneously can lead to a moderate reduction in recurrences and disability in people who have MS with remissions. Interferon-1a administered by the oral route was not effective for prevention of relapses. Side effects were usually influenza-like symptoms, injection site-reactions, pains in the joints and muscles, fatigue and headache.

Zugrunde liegende systematische Auswertung: Rice GP, Incorvaia B, Munari LM., Ebers G, Polman C, D’Amico R, Parmelli E, Filippini G. Interferon in relapsing-remitting multiple sclerosis. Cochrane Database of Systematic Reviews 2001, Issue 4. Art. No.: CD002002. DOI: 10.1002/14651858.CD002002

Deutsche Übersetzung von 2007, die ich auf den Stand 2009 angepasst habe (meine Ergänzungen sind schräg hervorgehoben):

Multiple Sklerose (MS) ist eine chronische Erkrankung des Nervensystems, welche junge und mittelalte Menschen befällt. Dabei können wiederholte Schädigungen der Myelinscheiden und anderer Nerventeile zu schweren körperlichen Behinderungen führen. Möglicherweise spielt das Immunsystem bei der MS eine Rolle. Interferone wirken vielfältig auf das Immunsystem ein, und sind gegen Viren aktiv. Interferone können helfen die Behinderung und Schübe zu reduzieren, aber es gibt nicht genügend Beweise (Evidenz) zu ihrem langfristigen Nutzen. Diese Studienübersicht zeigt, dass unter die Haut oder in die Muskeln gespritzte Interferone zu einer moderaten Verringerung in der Zahl der Schübe und der Behinderungen bei Patienten mit schubweiser MS beitragen können. Oral verabreichtes Interferon-1a war nicht wirksam bei der Verhinderung von Schüben. Unerwünschte Nebenwirkungen waren Grippe-ähnliche Symptome, Hautreizungen an der Injektionsstelle, Schmerzen in Gelenken und Muskeln, Müdigkeit und Kopfschmerzen.

Kritik an Cochrane

Häufig wird die Cochrane dafür kritisiert, dass sie zu wenige Studien in ihre Metaanalysen aufnähme, dass die Aufnahmekriterien zu streng seien. Doch nur gute Qualitätskriterien garantieren qualitativ gute Metaanalysen.

Problem fehlender Daten (Publication Bias)

Die systematischen Übersichtsarbeiten liefern nur richtige Resultate, wenn die veröffentlichten Daten dem vorhandenen Wissen entsprechen. Fehlende Daten sind aktuell aber ein grosses Problem, denn «positive» Resultate werden viel häufiger veröffentlicht als «negative». Forscher berichten viel lieber über etwas, das sie gefunden haben als über nicht gefundenes. Und Herstellern kommen «positive» Resultate viel gelegener.

Beispielsweise verheimlicht Roche die Studiendaten zu Tamiflu. Seit 2009 versucht Cochrane eine Metaanalyse machen. Roche rückt die Daten nicht raus. Die Staaten haben für Milliarden Franken Tamiflu gekauft und bis heute ist nicht klar, ob Tamiflu überhaupt hilft, siehe Tamiflu Saga.

Systematische Übersichtsarbeiten fallen wegen der verzerrten Veröffentlichung in der Tendenz eher zu positiv aus.

Die All Trials Initiative fordert die systematische Publikation von durchgeführten Studien, damit die evidenzbasierte Medizin funktioniert. Alles andere entspricht einer Medizin des Mittelalters – mit Aderlässen. Unterschreibt die Petition!

Weiterführende Literatur und Quellen

Dieser Artikel ist frei nach diesen Quellen geschrieben.

Zusammenfassung

Die evidenzbasierte Medizin arbeitet mit wissenschaftlichen Prinzipien. Fakten zählen. Die traditionelle Schulmedizin wird auch salopp als Eminenzbasierte Medizin beschrieben.

Evidenzbasierte Medizin will den aktuell besten Stand zu einer medizinischen Fragestellung geben. Ein wichtiges Mittel sind systematische Übersichtsarbeiten (Systematic Reviews) und Metaanalysen.

Das Nichtveröffentlichen von durchgeführten Studien untergräbt die evidenzbasierte Medizin.

Cochrane ist ein Grundpfeiler der evidenzbasierten Medizin. Alle sollten Cochrane kennen und die Cochrane Zusammenfassungen im Patientenalltag nutzen.

Am 3. April 2013 strahlte SRF Radio 2 in der Sendung Kontext eine Reportage über Cochrane aus: Die medizinischen Besserwisser – 20 Jahre Cochrane Collaboration (27min). Das unabhängige Expertennetzwerk «Cochrane Collaboration» bewertet seit zwanzig Jahren medizinische Therapien – nicht zur Freude aller.

Neues Buch «Bad Pharma» von Ben Goldacre – Empfehlenswert [akt. 2]

Was steht im Buch „Bad Pharma“? Warum ist es wichtig das Buch zu lesen? Wer ist der Autor Ben Goldacre? Wer soll das Buch lesen?

Ein neues, massstabsetzendes Buch über die Pharmaindustrie – und deren Machenschaften ist erschienen: Bad Pharma: How Drug Companies Mislead Doctors and Harm Patients, Harpercollins UK, 2012 books.ch, amazon.de (Nur Englisch.) Geschrieben hat es der Arzt und Kolumnist Ben Goldacre.

Dieses Buch ist derzeit das beste über die Machenschaften der Pharmaindustrie.

Ben Goldacre kommt aus England. Er ist Arzt, Forscher und Blogger. Er engagiert sich für gute Wissenschaft und gute Medizin. Bekannt wurde Ben Goldacre durch seine Kolumne „Bad Science“ in The Guardian, die er vor 10 Jahren begann. Er hat eine lockere Art zu schreiben, was zu unterhaltsamen Texten führt. Auch bei komplizierten Themen. In seiner Kolumne erklärte er wie Wissenschaft funktioniert, anhand von schlechten Beispiel, so wie man es nicht machen darf. Quacksalberei und Pseudowissenschaft werden durchleuchtet und aufs Korn genommen.

Im Jahre 2008 veröffentlichte er sein erstes Buch mit dem Titel Bad Science, gleichnamig wie seine Kolumne und sein Blog.
Das Buch wurde ein grosser Erfolg.

Bad Pharma

Bad Pharma Buch, Ben GoldacreBad Pharma Buch, Ben Goldacre

“Medicine is broken” ist der erste Satz des Buch, und weiter “the people you should have been able to trust to fix [its] problems have failed you.”

Das Buch beschreibt die Machenschaften der Pharmaunternehmen. Wie die Wissenschaft zu ihren Zwecken sabotiert wird – zum Schaden der Patienten und der Allgemeinheit.

Das Buch beleuchtet die verschiedenen Arten die Wissenschaft zu manipulieren: „Negative“ Studien nicht veröffentlichen, „negative“ Daten weglassen, „negative“ Daten uminterpretieren, die Rohdaten den Universitätsforschern vorenthalten und damite ein unabhängige und kritische Analyse verunmöglichen, gesetzliche Rahmenbedingungen zu ihren Zwecken verändern, Mediziner mit Marketing manipulieren, wissenschaftliche Artikel durch Ghostwriter verfassen lassen, …

Die einzelnen Elemente sind schon lange bekannt. Alles in einem Buch vorzufinden ist erschreckend. Während dem Lesen ist man einem Wechselbad der Gefühle ausgesetzt, Wut über die Missstände, traurig, dass es so weit kommen konnte und inspiriert und voller Tatendrang etwas zu verändern.

Das Buch listet nicht nur die Missstände auf, sondern es enthält auch konkrete Vorschläge, was getan werden kann – was getan werden muss. Für die verschiedenen Gruppen – Ärzte, Forscher, Regulierungsbehörden, Patienten, Patientenorganisationen, Forschungsförderungsinstitutionen, Politiker – sind Korrekturempfehlungen aufgelistet.

Eines der Hauptprobleme ist, dass die Pharmaunternehmen Daten zurückhalten und verstecken. Ein Kernpunkt der evidenzbasierte Medizin ist, dass alle zu einer Therapie ausgewertet werden, und nicht nur die Daten, die einem passen und gefallen (Rosinenpickerei, cherry-picking). Wenn jedoch schon von Anfang an Daten verheimlicht werden, ist die evidenzbasierte Medizin auf Sand gebaut.

> Positive findings are around twice as likely to be published as negative findings. This is a cancer at the core of evidence-based medicine. – Ben Goldacre
> Positive Resultate werden zweimal häufiger publiziert als negative Resultate. Das ist ein Krebs im Herzen der evidenzbasierten Medizin.

Beispielsweise hat Pfizer, das grösste Pharmaunternehmen der Welt, Hersteller von Viagra®, drei Viertel seiner Patientendaten seines Antidepressivums Reboxetin (Edronax®) nicht veröffentlicht. Nur die „positiven Daten“ wurden veröffentlicht. Gemäss aller vorhandenen wissenschaftlich publizierten Daten, ist das Medikament als wirksam. Wenn jedoch alle Daten herangezogen werden, verschwindet die Wirkung. Ist das Wissenschaft? Das traurige ist, dass Pfizer ganz legal gehandelt hat.

Noch trauriger ist, dass der Öffentlichkeit suggeriert wird, dass das Problem bereits gelöst wurde und nicht mehr auftreten kann. Im Buch bezeichnet er diese Korrekturen als „Fake Fixes“ (Scheinkorrekturen). Die Pharmaunternehmen behaupten nun, dass dies in der Vergangenheit gemacht wurde, dass sie sich aber gebessert hätten, und die nicht mehr vorkäme. Das macht das Problem gleich doppelt so schlimm: Nichts korrigiert und eine Korrektur ist nicht zu erwarten.

Regeln wurden aufgestellt, dass alle Studien vor Beginn registriert werden müssen und nur registrierte Studien in renommierten Fachzeitschriften veröffentlicht werden. Denn alle wollen ihre guten Resultate in renommierten Fachzeitschriften veröffentlichen – ein starker Anreiz. Nur das ist Theorie. Die Regeln wurden leider missachtet. Auch nicht-registrierte Studien wurden veröffentlicht. Der ganze Anreiz zerfällt. Ein „Fake Fix“.

Die besten Eindrücke vom Buch erhält mensch durch die frei verfügbare Indroduction.

Es ist wichtig, dass möglichst viele Leute den Inhalt des Buches „Bad Pharma“ kennen. [Aktualisierung 09.09.2013: Zur Zeit leider nur auf englisch erhältlich.] [Aktualisierung 09.09.2013: Mitte August ist die deutsche Übersetzung erschienen: Die Pharma-Lüge.]

Das Buch ist hochgradig relevant und geht uns alle an. Kauft es! Lest es! Sprecht darüber.

Buchkritiken

* The drug industry: Pick your pill out of a hat, The Economist, Sep. 2012
* The drugs don’t work: a modern medical scandal, The Guardian, 21. Sep. 2012
* Trisha Greenhalgh No such thing as a free lunch, British Journal of General Practice, 1. Nov. 2012, 62(604):594–594

> Ben Goldacre’s Bad Pharma: How Drug Companies Mislead Doctors and Harm Patients, a decimating critique of the pharmaceutical industry and the system-level problems that support ineffective and unsafe prescribing, is the new Harry Potter. Open it on the bus or tube and people will approach you to ask what chapter you’re up to. Scandalous, they say. Scandalous, you agree. Those overhearing your conversation will peek at the title and scribble it discreetly on the back of their ticket. As I write this, Goldacre is narrowly behind JK Rowling on the climb up Amazon’s top 20 chart.
Bad Pharma ist der neue Harry Potter. Wildfremde Menschen sprechen in der U-Bahn über das Buch. Skandalös, sagen sie. Skandalös, bestätigst du. Stille Zuhörer notieren den Titel auf der Rückseite ihres Tickets.

[Aktualisierung 14.02.2013: Peter Kleist, medizinischer Direktor des Pharmaunternehmens GlaxoSmithKline (GSK), nun in der Schweizerischen Ärztezeitung erfreulicherweise das Buch Bad Pharma in der Schweiz mit dem Artikel Nur hundertprozentige Transparenz schafft Vertrauen (2013;94: 7 [267]) vorgestellt und besprochen. (Die britische Pharmaindustrie reagierte wie in der Buchbesprechung angetönt etwas anders.) Hinweis: GSK musste in den USA 2012 3 Mrd. Dollar Busse bezahlen.]

TED-Talk

Ben Goldacre hat einen 14-minütigen Vortrag What doctors don’t know about the drugs they prescribe in der TED-Talk-Reihe zu den verheimlichten Studiendaten gemacht. Der Vortrag ist englisch [Aktualisierung 25.11.2012: mit deutschen Untertiteln], unterhaltsam und bietet einen guten Einstieg. Sehr empfehlenswert.

AllTrials.net

Um das Problem des Publication Bias ernsthaft anzugehen, haben Ben Goldacre, Iain Chalmers (James Lind Alliance, Cochrane Collaboration), Fiona Godlee (BMJ) und weitere die AllTrials.net Initiative Mitte-Januar gestartet. Alle sind aufgerufen die Petition zu unterschreiben. (Das Pharmaunternehmen GSK hat unterschrieben.)

[Aktualisierung 06.03.2013: Ein 60 minütiger (lustiger) Vortrag Book Discussion on Bad Pharma (engl.) von Ben Goldacre aus Seattle vom 18.02.2013. Sehenswert.]

[Aktualisierung 09.09.2013: Die lang ersehnte deutsche Übersetzung des Buches ist Mitte August erschienen: Die Pharma-Lüge. Prof. Peter T. Sawicki, Gründer des IQWiG, schreibt im Vorwort: «Das Buch behandelt die richtigen Themen pointiert und wissenschaftlich korrekt; und dies mit guten Beispielen und so allgemeinverständlich, dass sich jeder, der sich mit dem Thema auseinandersetzen will, einen profunden und breiten Einblick erhält und damit selbst zum Experten werden kann.»]