Buchbesprechung "Deadly Medicines and Organised Crime" von Peter Gøtzsche [Akt.]

Was ist der Inhalt von Peter Gøtzsches Buch „Deadly Medicines and Organised Crime“? Wer ist Peter Gøtzsche? Ist das Buch lesenswert?

Im neu erschienenen Buch „Deadly Medicines and Organised Crime: how big pharma has corrupted healthcare“ („Tödliche Medizin und organisiertes Verbrechen: Wie die Pharmaindustrie das Gesundheitswesen korrumpiert hat“) von Peter C. Gøtzsche wird die Pharmaindustrie beleuchtet. Es erscheint ein Jahr nach Ben Goldacre’s Bad Pharma.

Book cover "Deadly Medicines and Organised Crime"Deadly Medicines and Organised Crime | CC BY-SA-NC DES Daughter via flickr

Peter Gøtzsche ist Medizinprofessor in Dänemark, Mitbegründer der Cochrane Organisation und Leiter des Nordic Cochrane Centers. Ein wichtiger Wissenschaftler.

Interessant ist, dass Peter Gøtzsche beide Seiten, jene des unabhängigen Forschers, aber auch jene eines Pharmaangestellten kennt. Wie er im Buch beschreibt, ist es so gekommen, dass er nach seinem Biologiestudium beim Pharmaunternehmen Astra (heute Astra-Zeneca) seinen Berufseinstieg als Pharmareferenten machte.

Pharmareferenten sind gebildete Verkäufer, die den Ärzten die Medikamente des eigenen Unternehmens anpreisen. Sie besuchen und umgarnen Ärzte, so dass die Ärzte möglichst die eigenen Medikamente verschreiben. Pharmareferenten haben in der Regel keine medizinische Ausbildung.

Was Peter Gøtzsche sah, brachte in zum Nachdenken und seine Arbeit stellte ihn vor Gewissenskonflikte. Weckte aber auch sein Interesse und sein kritisches Denken. So nahm er parallel zu seiner Arbeit ein Medizinstudium auf. Sechs harte Jahre mit Doppelbelastung.

Er war fasziniert von der evidenzbasierten Medizin (EBM), welche sich in jener Zeit zu entwickeln begann. Eine Medizin, die sich auf Fakten stützt und nicht auf Hörensagen und pure Meinungen von Autoritäten.

Seine Erfahrungen als ehemaligen Insider der Pharmaindustrie und die Erkenntnisse der evidenzbasierten Medizin machten ihn zu einem Vorkämpfer gegen die Korruption in der Medizin.

In seinem Buch kommt Peter Gøtzsche zum Schluss: die Medizin ist kaputt. Wie schon Ben Goldacre in seinem Buch „Bad Pharma“.

Peter Gøtzsche geht noch weiter und vergleicht die Pharmaindustrie mit der organisierten Kriminalität: Wiederholter, planmässiger Betrug.

Er schreibt mit starken Worten. Nennt Dinge beim Namen.

The main reason we take so many drugs is that drug companies don’t sell drugs, they sell lies about drugs. This is what makes drugs so different from anything else in life…

Als evidenzbasierter Mediziner untermauert er seine Argumente mit Belegen.

Den Kennern der Materie beschreibt er nichts neues.

Man spürt seine ungeheure Wut nach all den Jahren ohne Fortschritte.

Vergleich mit Ben Goldacre’s „Bad Pharma“

Peter Gøtzsche und Ben Goldacre schreiben über das gleiche Thema und kommen zum gleichen Schluss. Beide Bücher deprimieren und machen wütend. Was ist das lesenswertere Buch?

Für mich ist Ben Goldacre’s „Bad Pharma“ das bessere Buch. Ben Goldacre ist für seinen unterhaltsamen Schreibstil bekannt. So ist „Bad Pharma“ unterhaltsam zu lesen, trotz des deprimierenden Inhalts. Zudem legt Ben Goldacre mehr Wert auf die Vermittelung von Hintergrundwissen als auf die Aufzählung von Fakten. Es ist lehrreicher. Man lernt mehr über das Funktionieren der medizinischen Wissenschaft. Lösungsmöglichkeiten werden besser aufgezeigt.

„Bad Pharma“ ist mittlerweile in diverse Sprachen übersetzt worden, auch deutsch.

Peter Gøtzsches Buch „Deadly Medicines and Organised Crime“ bleibt aber ein wichtiges Buch. Die Fakten sind sehr wertvoll.

Die Bedeutung von Peter Gøtzsches Buch ist an den Autoren der beiden Vorwörter ersichtlich. Zum einen Richard Smith, ehemaliger Chefredaktor (Editor-in-Chief) des BMJ und Drummond Rennie, Vizechefredaktor (Deputy Editor) des JAMA. BMJ und JAMA gehören zu den angesehensten Medizinzeitschriften (medical journals). Das Vorwort von Richard Smith kann auf seinem Blog gelesen werden. Es lohnt sich.

Fazit

Peter Gøtzsches Buch „Deadly Medicines and Organised Crime“ ist ein wichtiges Buch. Die Fakten sind sehr wertvoll. Ben Goldacre’s Bad Pharma ist aber lesenswerter.

Die beschriebenen Probleme der Medizin und der Pharmaindustrie sollten alle Leute kennen. Wenn die Probleme nicht genügend Leuten bekannt sind, werden sie auch nicht behoben.

Alle Personen mit Bezug zur Medizin sollten Ben Goldacre’s „Bad Pharma“ lesen.

Nachtrag

[Aktualisierung 06.12.2014: Peter Gøtzsches Buch ist auf deutsch erschienen: Tödliche Medizin und organisierte Kriminalität: Wie die Pharmaindustrie unser Gesundheitswesen korrumpiert. Zudem strahlt das Wissenschaftsmagazin von Radio SRF eine Buchbesprechung aus.]

[Aktualisierung 11.01.2015: Der Infosperber hat ein Kapitel der deutschen Übersetzung abgedruckt: Tödliche Medizin und organisierte Kriminalität, 21. Nov 2014]

Aaron Swartz – ein feiner Geist ist nicht mehr

Wer war Aaron Swartz? Warum ist er gestorben? Was hat er erreicht? Warum war er wichtig?

Aaron Swartz, 2008Aaron Swartz, 2008 | CC BY-NC-SA Elizabeth Brossa; via flickr

Im Internet habe ich nur einmal etwas von ihm gelesen, nach seiner Verhaftung. Doch mein Blog wäre ohne seine Arbeit ein anderer. Er war an massgeblichen Entwicklungen des freien Internets mitbeteiligt:

  • Mit 14 Jahren hat er den Nachrichten-Feed RSS mitentwickelt.
    (Ohne RSS gäbe es keine News-Feeds und keine automatisch verschickten E-Mails.)
  • Markdown wurde durch seine Rückmeldung verbessert.
    (Meine Texte schreibe ich in Markdown.)
  • Die Creative Commons Lizenzen hat er technisch vorangebracht.
    (Meine Texte lizenziere ich unter CC BY-SA und sein Photo unten kann ich wegen der CC Lizenz legal benutzen.)
  • Zusammen mit Tim Berners Lee, dem Erfinder des World Wide Web (WWW), hat er am Resource Description Framework (RDF) mitgearbeitet.
    (Die Metadaten des Blogs werden als RDFa angeboten.)
  • Den News-Dienst Reddit hat er mitaufgebaut.
  • Und sein Meisterstück war die Verhinderung der US Internet-Zensurgesetze PIPA und SOPA. Er hat den Protest organisiert. Der Höhepunkt war als Wikipedia und andere wichtige Portale ihre Dienste abschalteten und stattdessen eine scharze Protestseite zeigten.
    (Die Redefreiheit im Internet ist die Voraussetzung dieses Blogs.)

Am 11. Januar 2013 hat er sich mit 26 Jahren tragischerweise das Leben genommen (8. November 1986 – 11. Januar 2013).1

Freiheit war ihm wichtig. Er war Teil der Internetkultur. Er war ein Grosser.

Open Access von Forschungsresultaten war ihm wichtig. Er propagierte Guerilla Open Access:

Information is power. But like all power, there are those who want to keep it for themselves.

Those with access to these resources — students, librarians, scientists — you have been given a privilege. You get to feed at this banquet of knowledge while the rest of the world is locked out. But you need not — indeed, morally, you cannot — keep this privilege for yourselves. You have a duty to share it with the world.

Forschungsresultate müssen befreit werden. Er recht, wenn sie durch öffentliche Gelder bezahlt wurden und den Bürgern gehören.

Er redete nicht nur, sondern handelte auch gemäss seinem Manifest. Er hat Millionen von Forschungspublikationen (von JSTOR), aus dem nicht gesicherten MIT-Netzwerk, heruntergeladen. – Und wurde 2011 erwischt.

Danach wurde er gnadenlos vom Staat verfolgt und eingeschüchtert.2 Die Staatsanwaltschaft drohte ihm mit 35 Jahren Gefängnis und 1 Million Dollar Busse. Keine leere Drohung. Ein Hacker wurde vom selben Gericht zu zwanzig Jahren Gefängnis verurteilt.

In den USA werden Copyright-Verletzungen ähnlich stark wie Mord verfolgt, mit Strafen bis über 30 Jahre Gefängnis.3

Letztlich geht es im Fall von Aaron Swartz um Bürgerfreiheit gegenüber Wirtschaftsfreiheit. Freiheit des Einzelnen oder finanzielle Wirtschaftsinteressen. Ein Staat sollte für seine Bürger sein. Aber all zu oft ist es schon vorgekommen, dass finanzielle Interessen höher gewichtet wurden.

Sein Prozess hätte im Februar 2013 in New York stattfinden sollen.

Sein tragischer Tod hat eine Schockwelle durchs Internet ausgelöst:

Was hätte er in seinem Leben noch alles erreichen und bewirken können?

Nachtrag Dokumentarfilm 05.07.2014

Ende Juni, eineinhalb Jahre nach seinem Tod, ist ein sehr berührender Dokumentarfilm über das Leben von Aaron Swartz erschienen. Wie es sich für einen Film über einen der Miterfinder der freien Creative Commons Lizenz gehört, unter einer solchen freien Lizenz. Der Film wurde deshalb direkt frei auf Youtube gestellt. Wegen der freien Lizenz können Freiwillige selbständig an Untertiteln in andere Sprachen arbeiten.

Ein sehenswerter Film.

Der ganze Film: «The Internet’s Own Boy».

Welch ein geistiges Potential Aaron Swartz hatte, wird klar, wenn man weiss, dass Aaron mit drei Jahren bereits lesen konnte. Im Film werden Videoaufnahmen gezeigt.

Aaron is dead.

Wanderers in this crazy world,
we have lost a mentor, a wise elder.

Hackers for right, we are one down,
we have lost one of our own.

Nurtures, careers, listeners, feeders,
parents all,
we have lost a child.

Let us all weep.

Tim Berners-Lee, Erfinder des WWW


  1. Dass feine Geister depressive Stimmungen haben können, ist nichts neues. Er hatte aber in den letzten zwei Jahren keine Probleme mit Depressionen, wie fälschlicherweise immer geschrieben wird. 

  2. Staatsterror. Über welch umfassende Mittel der amerikanische Staat in Form seiner 15 Geheimdienste (NSA, CIA, FBI, DEA, …) verfügt, war zu dieser Zeit noch nicht bekannt. Edward Snowden enthüllte die staatliche Allmacht erst im Sommer. 

  3. Die Maximalstrafe von sieben Jahren Straflager für ein „Punkgebet“ von Pussy Riot in Putins-Russland nehmen sich da vergleichsweise Milde aus. Die russischen Künstlerinnen wurden schliesslich zu zwei Jahren Straflager verurteilt. 

Dossier Interessenkonflikte

Ich habe verschiedene Artikel zu Interessenkonflikten und Interessenbindungen geschrieben. Hier eine geordnete Zusammenstellung der Artikel:

Hintergrundinformationen

  1. Interessenkonflikt: Definition
  2. Unterschiede zwischen Interessenkonflikten und Korruption
  3. Interessenkonflikte, psychologische Mechanismen und deren Ausnutzung
  4. Umgang mit Interessenkonflikten

Richtlinien

In der Praxis

Weitere Artikel

Lektüre

Für eine vertiefte Lektüre zu Interessenkonflikten empfehle ich das lesenswerte Fachbuch von den Lieb, Klemperer und Ludwig:
Interessenkonflikte in der Medizin: Hintergründe und Lösungsmöglichkeiten. Klaus Lieb, David Klemperer, Wolf-Dieter Ludwig. 1. Aufl. Springer, 2011. books.ch, amazon.de

Mehr zum Buch, siehe Buchbeschreibung bei den Buchtipps.

Das Beratungsunternehmen "Cutting Edge Information" und dessen Berichte über KOL und ROI

Cutting Edge Information (CEI) ist ein auf die Pharmabranche spezialisiertes amerikanisches Beratungsunternehmen. Es wurde 2002 gegründet. Das Unternehmen erstellt Berichte (Reports) zu Themen der Pharmaindustrie. Die Pharmakonzerne sind die Kunden. Diese Berichte sind sehr aufschlussreich, gerade auch für Leute, die nicht in der Pharmaindustrie tätig sind.

Die Informationen dieser Berichte scheinen etwas Wert zu sein, denn ein Bericht für einen Leser kostet $7‘695 (single-user license) und für mehrere Leser $23‘995 (unlimited license).

Ich habe die Berichte einmal durchgesehen. Die spannendsten sind jene zu den Meinungsführern (Key Opinion Leader, KOL) und deren Rentabilität (Return on investment, ROI).

Bericht Stand
Pharmaceutical Key Opinion Leader Management (PH183)
Verwaltung/Management der Pharma KOL
2013
Promotional Speaker Programs (PH182)
Rednerprogramme zu Werbezwecken
2013
Pharmaceutical Continuing Medical Education (PH179)
Pharma-Weiterbildungsveranstaltungen
2013
Determining European KOL Compensation (PH150)
Festlegung der europäischen KOL-Bezahlung
2011
KOL Fair-Market Value and Aggregate Spend (PH155)
KOL-Marktwert und -Ausgaben
2011
Reinventing Pharmaceutical Sales Forces (PH127)
Neuerfindung der Pharmaverkaufsabteilungen
2009
Pharmaceutical Speaker Programs (PH134)
Pharma-Rednerprogramme
2009, ersetzt durch PH129 und PH182
Key Opinion Leader (PH122)
Meinungsführer
2009, ersetzt durch PH183

Cutting Edge Information Berichte über Key Opinion Leaders. Key Opinion Leader (KOL) sind Meinungsführer / Vorbilder.

Die Berichte werden etwa im Drei-Jahresrhythmus überarbeitet.

Wenn ich die obigen sechs Berichte kaufen würde, würde mich dies 46‘170 US Dollar kosten. Ich dürfte sie aber niemandem zeigen. Wenn ich dies tun wollte, müsste ich die teurere Variante kaufen, was mich 143‘970 US Dollar kosten würde.

Was lernen wir aus diesen Berichten?

Nur schon die öffentlich zugänglichen Informationen sind sehr interessant. Man sieht die Sichtweise und die Probleme, die es im Alltag eines Pharmakonzerns gibt.

Key Opinion Leader (KOL) scheinen für die Pharmakonzerne wichtig zu sein. Cutting Edge Information (CEI) hat verschiedene Berichte dazu geschrieben.

Key Opinion Leader (KOL) sind Meinungsführer / Vorbilder. Also führende Ärzte oder Forscher, an denen sich andere Ärzte orientieren. Beispielsweise sind es produktive Forscher oder Mitglieder wissenschaftlicher Gremien.

Pharmaceutical Key Opinion Leader Management (PH183) | Verwaltung der Pharma KOL

Dieser Bericht beschreibt, wie Pharmakonzerne die KOLs am besten pflegen und verwalten. Auch welche Datenbanken und Teamstrukturen am besten eingesetzt werden.

Empower teams to maintain thought leader relationships and companywide KOL databases.
Befähige Teams um Meinungsführerbeziehungen und firmenweite KOL-Datenbanken zu unterhalten.

Rather, [KOL management teams] primarily facilitate communication between commercial and medical teams in terms of how KOLs should be and are utilized and what KOL activities are most beneficial to the company.
[KOL-Management-Teams] stellen primär die Kommunikation zwischen kommerziellen und medizinischen Teams her in Bezug wie die KOLs benutzt werden sollen und werden und welche KOL-Aktivitäten die nützlichsten für das Unternehmen sind.

… which activities for individual KOLs provide the greatest companywide benefit by avoiding overusing specific thought leaders.
… welche Aktivitäten für einzelne KOLs den grössten Nutzen für die Firma bieten, unter Vermeidung von Übergebrauch von einzelnen Meinungsführern.

Unterscheidungsmerkmale für KOLs aus dem Key Opinion Leaders (PH122) Bericht von 2009:

  • Erfahrungsjahre (Years of experience)
  • Publikationen pro Jahr (Number of publications per year)
  • Anzahl Vorträge pro Jahr (Number of speeches delivered per year)
  • Ärztekategorie (Provider category)
  • Geographischer Einfluss (Geographic influence)
  • Klinischer Forschungshintergrund (Clinical research background)
  • Schnelles Einsetzen von Neuem (Early-adopter profile)
  • Ausbildungsniveau (Education level)
  • Niveau der jährlichen Beratungsbeträge (Level of annual advising fee funding)
  • Niveau der jährlichen Forschungsförderung (Level of annual grant funding)

Veranstaltungen mit Rednern

Pharmaceutical Speaker Programs (PH134) | Pharma-Rednerprogramme

Der Bericht Pharmaceutical Speaker Programs (PH134) von 2009 wurde in die zwei Berichte Promotional Speaker Programs (PH182) und Pharmaceutical Continuing Medical Education (PH179) aufgeteilt. Heutzutage ist die Unterscheidung zwischen Ärzteweiterbildung und Werbeveranstaltung wichtiger geworden, was auch mit neuen gesetzlichen Anforderungen zusammenhängt.

Pharmaceutical Speaker Programs provides innovative, actionable strategies and best practices that will make your speaker events more effective and generate better ROI.
Diese Pharma-Rednerprogramme bieten innovative, verfolgbare Strategien und bewährte Vorgehensweisen, die ihre Vortragsveranstaltungen effektiver und rentabler machen.

Did they [speaker] answer questions about the product in a positive way?
Haben sie [Redner] die Fragen über die Produkte auf eine positive Art beantwortet?

Pharmaceutical Continuing Medical Education (PH179) | Pharma-Weiterbildungsveranstaltungen

Berät, wie Ärzte-Weiterbildungsprogramme betrieben und wie deren (finanzielle) Erfolge gemessen werden können.

Event success depends on recruiting the right speakers with large spheres of influence.
Der Veranstaltungserfolg hängt von der Anwerbung der richtigen Redner mit einer grossen Einflusssphäre ab.

… speaker recruitment, compensation, ROI assessments and future trends, detailed metrics and fresh insights will elevate the impact of your educational speaker programs.
… Redneranwerbung, Bezahlung, Rentabilitätsbeurteilung und zukünftige Trends, detaillierte Messwerten und neue Einsichten werden die Auswirkung ihrer Weiterbildungsveranstaltungen erhöhen.

Promotional Speaker Programs (PH182) | Rednerprogramme zu Werbezwecken

Beschreibt wie erfolgreiche Rednerprogramme zu Werbezwecken wie beispielsweise Podiumsdiskussionen aussehen, wie deren Rentabilität gemessen werden kann, wie die Redner (Speaker Bureaus) gepflegt und wie neue Meinungsführer gewonnen werden.

Leverage physician satisfaction ratings and feedback surveys to determine speaker programs’ impact on doctors’ habits.
Nutze Zufriedenheitsbewertungen der Ärzte und Rückmeldungsumfragen um den Einfluss von Rednerprogrammen auf die Gewohnheiten der Ärzte zu messen.

Gemäss den Richtlinien der Schweizerischen Akademie der Medizinischen Wissenschaften (SAMW) ist die Teilnahme von Schweizer Ärzten an solchen Aktivitäten verboten.

Determining European KOL Compensation (PH150) | Festlegung der europäischen KOL-Bezahlung

Dieser Bericht analysiert die Bezahlung von KOLs in Europa und wie der Anschein von Korruption vermieden werden kann. Dies ist ein ganzer Bericht über die Bezahlung von Meinungsführern (KOL).

The study is dedicated to helping companies understand the unique differences in key opinion leader (KOL) compensation that exist in Europe.
Diese Studie soll den Konzernen helfen die Unterschiede zwischen den KOL-Bezahlung zu verstehen, die in Europa bestehen.

KOL Fair-Market Value and Aggregate Spend (PH155) | KOL-Marktwert und -Ausgaben

Dieser Bericht analysiert die Bezahlung von KOLs in den USA und wie der Anschein von Korruption vermieden werden kann. Dies ist ein ganzer Bericht über die Bezahlung von Meinungsführern (KOL). Die Änderungen mit dem neuen Pharmatransparenzgesetz (Physician Payment Sunshine Act) der Vereinigten Staaten werden erläutert.

What are the most effective activities for which to utilize KOLs?
Was sind die wichtigsten Aktivitäten für welche die KOLs verwendet werden sollten?

Pharmaceutical companies cannot offer the lucrative honoraria they had in the past, forced to draw the line at fair-market value.
Pharmakonzerne können nicht mehr die lukrativen Honorare der Vergangenheit bezahlen; sie sind gezwungen sich auf faire Marktwerte zu beschränken.

The general consensus is that physicians are not excited about having their names appear on list after list of industry ties.
Der generelle Konsens besteht, dass Ärzte es nicht schätzen ihre Namen auf Listen im Zusammenhang mit der Industrie vorzufinden.

Fazit

Bei Cutting Edge Information und in der Pharmaindustrie sind keine Amateure am Werk.

Das neue Pharmatransparenzgesetz (Physician Payment Sunshine Act) der Vereinigten Staaten zeigt bereits seine Wirkung. Seit dem Jahre 2010 scheinen sich die Möglichkeiten eingeschränkt zu haben, nur schon durch das Einfordern von vermehrter Transparenz.

In allen diesen Berichten werden Messwerte (Metriken) angegeben, wie die Wirkung gemessen werden kann. Was am Schluss bei allen diesen Programmen zählt, ist, ob es für den Pharmakonzern rentabel (ROI) ist.

Meinungsführer (Key Opinion Leader, KOL) scheinen sehr wichtig für die Pharmaindustrie zu sein und sind eine kritische Ressource. Die KOLs werden gehegt, gepflegt und verwaltet („gemanagt“).

Sicherheit (Kryptographie)

Sicherheit im Internet wird immer wichtiger. Der Blog Patientensicht unterstützt deshalb verschiedene Sicherheitsverfahren.

Dies ist einmal ein Anfang um sich mit der Materie vertraut zu machen.

Wie wir wissen ist Sicherheit kein Zustand, sondern ein Prozess.

Sichere Website über SSL/TLS

Der Blog Patientensicht kann verschlüsselt über SSL/TLS (https) abgerufen werden: https://patientensicht.ch

Dabei kann auf dem Blog normal gelesen werden, die Daten werden verschlüsselt übertragen. Die einzige Änderung ist die Internet-Adresse mit https://.

Eine sichere Übertragung der Webseite ist erkennbar am Schloss neben der Internet-Adresse.

SchlüsselbildCC BY-SA David Gothberg, via Wikimedia

Sichere Kommunikation

Für die sichere Kommunikation unterstützt der Blog Patientensicht das gängige Verschlüsselungs- bzw Signaturverfahren OpenPGP.

GPG | GnuPG | OpenPGP | PGP

Der öffentliche PGP Schlüssel.

-----BEGIN PGP PUBLIC KEY BLOCK-----
Comment: User-ID:   ibex
Comment: Created:   17.08.19 16:36
Comment: Expires:   31.12.24 12:00
Comment: Fingerprint:   476B87BB3E9D46BF96D1E01020F15A0F8AA9F048

mDMEXVgQ3hYJKwYBBAHaRw8BAQdA5pvbFhHwnu9rOLboWRmwPXwwaXZ0sytFq5iL
9Qq9WRa0HWliZXggPGliZXhAcGF0aWVudGVuc2ljaHQuY2g+iJYEExYIAD4WIQRH
a4e7Pp1Gv5bR4BAg8VoPiqnwSAUCXVgQ3gIbIwUJChu90gULCQgHAwUVCgkICwUW
AgMBAAIeAQIXgAAKCRAg8VoPiqnwSP2SAP9vMim88Ht1EQofF8QrewA4LB4eJcKt
0DWHgrT/wbaqewD+MP3GlIF4C/sjFpadYCZcxnQ7LrTX3IXDSCD87d1JiA64OARd
WBDeEgorBgEEAZdVAQUBAQdAumTlAxVkCl5sp9QPMSSwSvLsj4DjFDBtejTZjK+Y
mQADAQgHiH4EGBYIACYWIQRHa4e7Pp1Gv5bR4BAg8VoPiqnwSAUCXVgQ3gIbDAUJ
Chu90gAKCRAg8VoPiqnwSKX4AP49soLwkEq1LGc8HKuHPC2H/w83rhk2Mbr5yOkW
Lg3yYQD/Wa6rbQbIy1C9Ye4P7O8ZsDHWfwERtkkFFr+x0oYosQU=
=uYJx
-----END PGP PUBLIC KEY BLOCK-----

Überarbeitete WMA Deklaration von Helsinki 2013, mit verbessertem Versionsvergleich

Die Deklaration von Helsinki (DoH): Ethical Principles for Medical Research Involving Human Subjects wurde von der World Medical Association (WMA) an der 64. WMA Generalversammlung, Fortaleza, Brasilien, Oktober 2013 überarbeitet.1

Die Deklaration von Helsinki regelt die ethischen Prinzipien der medizinischen Forschung mit Menschen. Für medizinische Entscheidungen werden gesicherte Daten zu Behandlungen benötigt. Diese Daten können nur mit einer Überprüfung an Menschen gefunden werden. Das ist wichtig, aber auch heikel. Deshalb wurde die Deklaration von Helsinki zur medizinischen Forschung an Menschen im Jahre 1964 vom Weltärztebund (World Medical Association, WMA) geschaffen, welche nun in einer überarbeiteten Version vorliegt.

Die neue Deklaration ersetzt die letzte Version von 2008 von der 59. WMA Generalversammlung, Seoul, Korea, Oktober 2008. Die Texte liegen nur auf englisch vor.

Was hat sich geändert?

Die Unterschiede in neuen Richtlinien zu finden ist nicht einfach. Leider wird häufig kein Versionsvergleich von den Erstellern zur Verfügung gestellt. Das ist Schade, da dann niemand weiss, was sich mit der neuen Version eigentlich geändert hat.

Verbesserter Versionsvergleich

Mein erster Versionsvergleich zeigt grosse Differenzen zwischen den Versionen. Eine Analyse zeigt, dass Textverschiebungen der Grund sind.

Um einen besseren Vergleich zu erhalten, habe ich die beiden Versionen einander strukturell angeglichen.

Der neue, verbesserte Wort für Wort Vergleich (HTML, 196 KiB).

Durch Klicken auf den obigen Link, wird eine statische HTML-Datei mit den Unterschieden angezeigt.

Angleichung der beiden Versionen

Für einen besseren Verglich habe ich die Versionen minimal einander angeglichen; hauptsächlich habe ich die Paragraphen der Version 2008 verschoben. Die Version 2013 habe ich kaum verändert.

Änderungen an der Version 2008:

  • Die Paragraphen an die selbe Position wie in der Version 2013 verschoben.
  • Zwei Paragraphen aufgeteilt und markiert mit [TOx], [FROMx], beispielsweise [TO5‘], [FROM5]. Die verschobenen Teile habe ich mit geschwungenen Klammern „{}“ eingerahmt.
  • Synchronisationspunkte in beiden Versionen eingefügt, beispielsweise [SYNC3-4], wobei die erste Zahl die Paragraphennummer der Version 2008 und die zweite die Paragraphennummer der Version 2013 ist.
  • Sichtbare Leerzeichen „·“ hinzugefügt um den Zeilenumbruch in Übereinstimmung zu bringen.

Änderungen an der Version 2013:

  • Synchronisationspunkte in beiden Versionen eingefügt, beispielsweise [SYNC3-4], wobei die erste Zahl die Paragraphennummer der Version 2008 und die zweite die Paragraphennummer der Version 2013 ist.
  • Sichtbare Leerzeichen „·“ hinzugefügt um den Zeilenumbruch in Übereinstimmung zu bringen.

Umsetzung

Ich habe beide Version heruntergeladen2, diese von Hand in Markdown umgeschrieben und die Versionen minimal angeglichen. Nachher habe ich das folgende Skript, welches Pandoc für die Normalisierung und html2diff für die Formatierung benutzt, aufgerufen.

#!/bin/bash

# Normalize
pandoc -f markdown_phpextra -t markdown_phpextra --atx-headers -o doh2013.sync.norm.md doh2013.sync.md
pandoc -f markdown_phpextra -t markdown_phpextra --atx-headers -o doh2008.sync.norm.md doh2008.sync.md

# Diff
diff -U9999999 --minimal doh2008.sync.norm.md doh2013.sync.norm.md > doh_2008_2013_sync.diff

# Generate pretty HTML
diff2html.py -o doh_2008_2013_sync.diff.html -i doh_2008_2013_sync.diff -a 1

Die nötigen Programme sind alle Open Source und die Daten im Anhang (Open Data). Einer Wiederholung oder einer Verbesserung steht nichts im Wege.

Ich habe früher bereits einen ähnlichen Vergleich für die SAMW Richtlinien: Zusammenarbeit Ärzteschaft – Industrie, Überarbeitung 2013 durchgeführt und konnte von den Vorarbeiten profitieren.

Grund

Ich habe diesen Vergleich erstellt, da ich den folgenden Tweet von Ben Goldacre gesehen habe:

anyone written an interesting commentary on new Declaration of Helsinki yet? Important changes? http://jama.jamanetwork.com/article.aspx?articleid=1760318

Bemerkungen

Der verbesserte Versionsvergleich zeigt die Änderungen viel klarer. Die Änderungen können nun im Detail analysiert werden.

Ausser diesem strukturellen Vergleich habe ich mich noch nicht weiter mit diesem neuen Dokument beschäftigt. Meine inhaltliche Auseinandersetzung liegt noch vor mir. Da andere vielleicht von diesem Wort für Wort Vergleich profitieren können, stelle ich ihn einmal zur Verfügung. So kann es eine Arbeitsteilung geben.

  1. Ich hoffe dieser Nebeneinandervergleich ist hilfreich.
  2. Ich hoffe in Zukunft werden Versionsvergleiche von den Erstellern zur Verfügung gestellt.

  1. World Medical Association (2013). WMA Declaration of Helsinki: Ethical Principles for Medical Research Involving Human Subjects JAMA DOI: 10.1001/jama.2013.281053 

  2. Die Deklaration von Helsinki 2008 im Internet zu finden, war gar nicht so einfach. Die Revisionsverwaltung und die Archive könnten wirklich besser sein. 

Überarbeitete WMA Deklaration von Helsinki 2013, mit Versionsvergleich

Die Deklaration von Helsinki (DoH): Ethical Principles for Medical Research Involving Human Subjects wurde von der World Medical Association (WMA) an der 64. WMA Generalversammlung, Fortaleza, Brasilien, Oktober 2013 überarbeitet.1

Die neue Deklaration von Helsinki ersetzt die Version von 2008 von der 59. WMA Generalversammlung, Seoul, Korea, Oktober 2008. Die Texte liegen nur auf englisch vor.

Was hat sich geändert?

Die Unterschiede in neuen Richtlinien zu finden ist nicht einfach. Leider wird häufig kein Versionsvergleich von den Erstellern zur Verfügung gestellt. Das ist Schade, da dann niemand weiss, was sich mit der neuen Version eigentlich geändert hat.

Versionsvergleich

[Aktualisierung 22.10.2013: Ich habe den Versionsvergleich verbessert, siehe verbesserten Versionsvergleich.]

Ich habe einen Wort für Wort Vergleich (HTML, 307 KiB) erstellt, um einen Anfang zu machen.

Durch Klicken auf den obigen Link, wird eine statische HTML-Datei mit den Unterschieden angezeigt.

Grund

Ich habe diesen Vergleich erstellt, da ich den folgenden Tweet von Ben Goldacre gesehen habe:

anyone written an interesting commentary on new Declaration of Helsinki yet? Important changes? http://jama.jamanetwork.com/article.aspx?articleid=1760318

Umsetzung

Ich habe beide Version heruntergeladen2 und diese von Hand in Markdown umgeschrieben. Nachher habe ich das folgende Skript, welches Pandoc für die Normalisierung und html2diff für die Formatierung benutzt, aufgerufen.

#!/bin/bash

# Normalizes
pandoc -f markdown_phpextra -t markdown_phpextra --atx-headers -o doh2013.norm.md doh2013.md
pandoc -f markdown_phpextra -t markdown_phpextra --atx-headers -o doh2008.norm.md doh2008.md

# Diff
diff -U9999999 --minimal doh2008.norm.md doh2013.norm.md > doh_2008_2013.diff

# Generate pretty HTML
diff2html.py -o doh_2008_2013.diff.html -i doh_2008_2013.diff -a 1

Ich habe früher bereits einen ähnlichen Vergleich für die SAMW Richtlinien: Zusammenarbeit Ärzteschaft – Industrie, Überarbeitung 2013 durchgeführt und konnte von den Vorarbeiten profitieren.

Bemerkungen

Ausser diesem strukturellen Vergleich habe ich mich noch nicht weiter mit diesem neuen Dokument beschäftigt. Meine inhaltliche Auseinandersetzung liegt noch vor mir. Da andere vielleicht von diesem Wort für Wort Vergleich profitieren können, stelle ich ihn einmal zur Verfügung. So kann es eine Arbeitsteilung geben.

  1. Ich hoffe dieser Nebeneinandervergleich ist hilfreich.
  2. Ich hoffe in Zukunft werden Versionsvergleiche von den Erstellern zur Verfügung gestellt.

  1. World Medical Association (2013). WMA Declaration of Helsinki: Ethical Principles for Medical Research Involving Human Subjects JAMA DOI: 10.1001/jama.2013.281053 

  2. Die Deklaration von Helsinki 2008 im Internet zu finden, war gar nicht so einfach. Die Revisionsverwaltung und die Archive könnten wirklich besser sein. 

Auswertung der unterstützten Forschungsprojekte der MS-Gesellschaft (2008 – 2013)

Die MS-Gesellschaft hat die Liste der unterstützten Forschungsprojekten mit den Projekten der zweiten Hälfte 2013 ergänzt. Besten Dank an die MS-Gesellschaft für das Pflegen dieser Angaben.

Mit diesen neuen Daten habe ich die letzte Auswertung mit den neuen Projekten ergänzt.

Auswertung Forschungsförderung

Die graphische Auswertung der unterstützten Forschungsprojekte von 2008 bis 2013 zeigt folgendes Bild:

Anzahl Forschungsprojekte nach Universitäten, 2008 - 2013Anzahl Forschungsprojekte nach Universitäten, 2008 – 2013

Unterstützte Forschungsprojekte nach Fachgebiet, 2008 - 2013Unterstützte Forschungsprojekte nach Fachgebiet, 2008 – 2013

Auswertung

  • Seit 2008 wurden 149 Projekte unterstützt.
  • Rund 7.5 Mio. Franken wurden in den letzten sechs Jahren für die Forschungsförderung ausgegeben. Die MS-Gesellschaft vergibt jährlich etwa 1.2 Mio. Franken.
  • Ein unterstütztes Projekt erhält im Durchschnitt 50‘000 Franken.
  • Die unterstützten Projekte werden mehrheitlich an die Schweizer Universitäten vergeben. Etwa die Hälfte der Projekte wurde an die Universitäten Basel und Zürich vergeben. Die Aufteilung ist in der ersten Grafik dargestellt.
  • Die MS-Gesellschaft hat zu über zwei Dritteln immunologische Forschung unterstützt, wovon 16 Projekte zur Mausforschung (EAE) gehören. Die zweite Grafik zeigt die Aufteilung nach Fachgebieten.1
  • Die 149 unterstützten Projekte wurden auf 82 verschiedene Personen verteilt.
  • 32 Projekte wurden an Forscher vergeben, die selbst im wissenschaftlichen Beirat (2013: 31 Mitglieder) sind, der diese Forschungsförderung vergibt.
  • 56 unterstützte Projekte wurden von Professoren eingereicht.
  • Die am stärksten geförderten Unis der letzten sechs Jahre sind:2
    • Universität Zürich: Fr. 1.9 Mio. Franken
    • Universität Basel: Fr. 1.7 Mio. Franken
    • Universität Genf: Fr. 1.3 Mio. Franken

Die folgende Tabelle zeigt die Forscher mit drei und mehr Projekten:

Forscher Anzahl Projekte ~Förderungsbetrag kCHF2
Burkhard Becher 6 306
Danielle Burger 6 306
Ruth Lyck 6 306
Britta Engelhardt 6 306
Walter Reith 6 306
Tobias Suter 5 255
Patrice Lalive 5 255
Raija Lindberg 5 255
Renaud Du Pasquier 4 204
Adriano Fontana 4 204
Paul Grossman 4 204
Norbert Goebels 4 204
Andrea Huwiler 3 153
Nanco van der Maas 3 153
Cornel Fraefel 3 153
Jan Lünemann 3 153
Nicole Schaeren-Wiemers 3 153
Burkhard Ludewig 3 153

Forscher, die seit 2008 drei und mehr geförderte Projekte haben. Die Veränderungen seit der letzten Auswertung sind gelb markiert und schräg geschrieben. kCHF = Kilo Franken, also Beträge in 1000 Franken; Datenquelle: MS-Gesellschaft, eigene Auswertung.

Im Sinne von Open Data ist die Auswertung als Tabellendokument, wie schon seit Beginn, als Anhang verfügbar.

Projekte des Jahres 2013

Die folgenden Grafiken zeigen die neu hinzugekommen Projekte des Jahres 2013.

Anzahl Forschungsprojekte nach Universitäten, 2013Anzahl Forschungsprojekte nach Universitäten, 2013

Neu unterstützte Forschungsprojekte nach Fachgebiet, 2013Neu unterstützte Forschungsprojekte nach Fachgebiet, 2013

Kohortenstudie (SMSC-Study)

Neben der Förderung einzelner Projekte, lässt die MS-Gesellschaft eine Kohortenstudie (SMSC-Study) durchführen. Die Kohortenstudie erfasst systematisch Daten von einer Gruppe von Patienten über einen längeren Zeitraum für gezielte Auswertungen. Diese Studie ist ein grosses, wichtiges und langfristiges Projekt. Im Forte 2/2012 Artike (Seite 18) wurde über die Kohortenstudie berichtet. Die Kohortenstudie ist in dieser Auswertung nicht enthalten. Keine Zahlen zur Finanzierung und den Kosten sind bekannt. Im Artikel werden nur Grundsätze zur Finanzierung genannt.

Dank der grosszügigen Unterstützung durch die MS-Gesellschaft und ihr nahestehender Stiftungen kann die finanzielle Basis für dieses Grossprojekt für die nächsten 3 bis 5 Jahre sichergestellt werden, ohne die Dienstleistungen für MS-Betroffene oder die reguläre Forschungsförderung zu beeinträchtigen.

Im Geschäftsbericht 2012 der MS-Gesellschaft ist diese Studie nicht separat ausgewiesen. Die der MS-Gesellschaft „nahestehenden Stiftungen“ sind im Geschäftsbericht ebenfalls nicht erwähnt.

Die Koordination der Kohortenstudie erfolgt am Universitätsspital Basel.

Auf die Kohortenstudie werde ich in einem eigenen Artikel vertiefter Eingehen.

Fazit

Die Verteilung der Projekte auf die verschiedenen Universitäten und die einzelnen Personen ist ok. Inhaltlich ist die immunologische Forschung mit zwei Drittel der Projekte klar dominant. Die Immunologie ist der deutliche Schwerpunkt der geförderten Forschung der MS-Gesellschaft.

Weitere Informationen zur Kohortenstudie, wie Finanzierungsangaben, wären wünschenswert.

Aus Patientensicht würde ich mir wünschen, wenn die MS-Gesellschaft als Betroffenenorganisation die Prioritäten der Betroffenen in die Forschungsförderung klarer einfliessen lassen würde. Für Patienten relevante Fragestellungen, die sonst zu kurz kommen, sollten in der geförderten Forschung in erster Linie berücksichtigt werden.


  1. Die Zuordnung zu den Fachgebieten habe ich aufgrund des Projekttitels vorgenommen. Eine Beschreibung oder Zusammenfassung der einzelnen Projekte stand mir nicht zur Verfügung. Ungenaue Zuordnungen sind deshalb wahrscheinlich. 

  2. Unter der Annahme gleich grosser Projekte. 

Statistische Signifikanz (p-Wert) in Studien (mit Simulator)

Was bedeutet signifikant? Was bedeutet statistisch signifikant? Was bedeutend der statistische p-Wert? Warum wird der p-Wert eingesetzt?

Statistik ist ein wesentlicher Teil empirischer, wissenschaftlicher Studien. Kenntnisse in Statistik sind notwendig.

Ich hatte einmal etwas Statistik, doch das ist schon länger her. Zur Auffrischung und zum Erklären habe ich diesen Artikel mit einem kleinen Statistik-Simulator geschrieben. Der Simulator soll zum Ausprobieren animieren. Beim Artikel stand nicht die mathematische Präzision im Vordergrund, sondern das intuitive Verständnis.

Die mathematischen Symbole und der Simulator werden dynamischen (mit JavaScript) erstellt. Aus diesem Grund wird der Artikel in RSS-Feeds und versandten E-Mails nicht vollständig angezeigt und ausführbar sein. Der Simulator funktioniert im Web-Browser.

Münz-Beispiel

Der Simulator stellt ein kleines Beispiel dar. Wir simulieren eine Münze. $0$ ist Kopf. $1$ ist Zahl. Die Stichprobe (Beobachtung, Datenerhebung) besteht aus $n$ Würfen.

Wir können uns nun fragen, ob die Münze fair ist, ob Kopf und Zahl gleich wahrscheinlich sind oder ob eine der beiden Seiten wahrscheinlicher ist. Ähnlich der Frage, ob Behandlungserfolge zufällig sind oder auf die Wirkung der Behandlung zurückgehen.

Statistische Tests

Bei Stichproben aus Datenerhebungen stellt sich die Frage, ob die Stichprobe «ein Muster» zeigt oder, ob die Stichprobe im Rahmen des Zufalls ist. Um diese Frage zu beantworten gibt es statistische Tests. Je nach Problemfeld und erhobenen Daten kommen verschiedene Tests zum Einsatz.

Mathematik ist eine Sprache und ein Werkzeug. Um das Problem statistisch bearbeiten zu können, müssen wir es übersetzen. Um die spätere Bearbeitung zu erleichtern wird es in eine bestimmte Form gebracht.

Die zu überprüfende Hypothese, dass Kopf und Zahl gleich wahrscheinlich sind, wird als Nullhypothese $H_0$ bezeichnet. Die gegenteilige Hypothese wird als Alternativhypothese $H_1$ bezeichnet.

$H_0$: Die Wahrscheinlichkeit $p$ für Kopf ist gleich der Wahrscheinlichkeit für Zahl, oder formal $p = 1/2$.

$H_1$: Die Wahrscheinlichkeiten sind unterschiedlich. Es gilt also: $p \ne 1/2$.

Ja/Nein, $0/1$ Experimente sind binominalverteilt. Sie gehorchen der Binominalverteilung.

Im statistischen Test wird nun geprüft wie wahrscheinlich eine Stichprobe bei einer Binominalverteilung ist. Es wird der p-Wert der Stichprobe bestimmt. Ein zuvor festgelegter Signifikanzschwellwert $\alpha$, typischerweise $0.05$, sagt ab welchem p-Wert die Nullhypothese verworfen wird. Falls die Wahrscheinlichkeit der Stichprobe kleiner als dieser Signifikanzschwellwert ist, wird die Nullhypothese verworfen und die Alternativhypothese angenommen.

Kompakter geschrieben:

$H_0$: $p = p_0$

$H_1$: $p \ne p_0$ (bei zweiseitiger Fragestellung)

Unter der Nullhypothese ist die Stichprobe binomialverteilt mit dem Erwartungswert $n p_0$.

Es gibt verschiedene statistische Tests um binominalverteilte Stichproben zu prüfen.

  • Binominaltest für eine Stichprobe
    • Binominaltestnäherung für eine hinreichend grosse Stichprobengrösse
  • Chi2-Test für eine Stichprobe mit einem 2-fach gestuften Merkmal

Simulator

Ich habe für die oben beschriebenes Münzbeispiel einen Simulator geschrieben. $0$ ist Kopf, $1$ ist Zahl. $p_0$ ist die gegebene Wahrscheinlichkeit für Kopf. Diesen Wert wollen wir statistisch überprüfen. Im Simulator kann $p_0$ mit einem Schieberegler eingestellt werden.

Die Grösse einer Stichprobe kann mit dem Schieberegler $n$ eingestellt werden. Eine Stichprobe entspricht einem Experiment. Dies könnte in der Realität einer Studie entsprechen.

Im Simulator ist es leicht viele Wiederholungen des Experimentes zu machen und viele Stichproben auswerten zu können.

Mit dem Simulator kann gespielt und intuitiv ausprobiert werden.

Interessante Szenarien sind:

  • Wie viele falsche signifikante Ergebnisse gibt es? Wie häufig wird die Nullhypothese verworfen bei $p_0 = 1/2$, also eine fairer Münze, wo die Nullhypothese gilt? (Mit Parameter Anzahl Läufe $m$ spielen.)
    • Wie abhängig ist die Anzahl signifikanter Ergebnisse von der Stichprobengrösse? (Mit Parameter $n$ spielen, beispielsweise $n = 40$ oder $n = 100$.)
  • Wie unfair muss eine Münze sein, damit die Nullhypothese verworfen wird, also ein signifikantes Ergebnis erzielt wird. ($p_0$ auf $0.51$, $0.6$ und $0.7$ setzen). Wie aggressiv wird $H_0$ verworfen?
    • Gleichzeitig kann der Einfluss der Stichprobengrösse untersucht werden. (Mit Parameter $n$ spielen, beispielsweise $n = 40$ oder $100$.)

Viel Spass beim Simulieren!

Beobachtungen

Wir sehen, dass für eine recht unfaire Münze (Bsp. $p_0 = 0.66$) genügen schon wenige Stichproben (Bsp. $n = 20$), um eine statistisch zuverlässige Aussage mit tiefem p-Wert zu erhalten. (Kontrolle mit $m = 100$).

Umgekehrt kann für eine kleine Unfairness (Bsp. $p_0 = 0.51$) mit einer grossen Stichprobe (Bsp. $n = 1000$) ein signifikantes Ergebnis mit (p-Wert $

Die statistische Signifikanz sagt nichts über die Relevanz eines Ergebnisses. Die Signifikanz bzw. Relevanz kann nicht von der statistischen Signifikanz abgeleitet werden. Die statistische Signifikanz gibt nur eine Antwort, ob ein Resultat zufällig oder überzufällig ist.

Da es sich um ein mathematisches Modell handelt, könnte man sich für $0$ auch eine Geburt eines Knaben denken und für $1$ die Geburt eines Mädchens. Das wird mit diesem $0/1$ Modell genauso abgebildet. Gibt es statistisch mehr Geburten eines Geschlechts? Mehr Knaben, mehr Mädchen?

Literaturangaben

Für die Erstellung dieses Artikels habe ich Wikipedia (p-Wert, Binomialtest, Chi-Quadrat) und das Buch Basiswissen Medizinische Statistik, Christel Weiß, 5., überarbeitete Auflage. Springer, 2010 benutzt.

Quellcode

Im Sinne von Open Source ist hier der Simulator abrufbar: p-Wert 1 Stichproben Simulator.js

Als Statistik-Hilfsprogramm habe ich jstat verwendet. Die wunderschöne mathematische Darstellung erstelle ich mit MathJAX. Die Simulatorbenutzeroberfläche habe ich mit jQuery und jQuery UI gemacht.

Ausblick

Im vorliegenden Simulator habe ich den einfachst möglichen Simulator erstellt. Kopf/Zahl werden mit $0/1$ abgebildet. Das Prinzip kann demonstriert werden. Auf die Thematik von ein- und zweiseitigen Tests bin ich nicht eingegangen.

Der Simulator kann noch erweitert werden:

  1. Wie in klinischen Studien üblich, kann eine Kontrollgruppe (z.B. mit Placebo) einbezogen werden.
  2. Die Statistik einer echten, grossen Studie könnte nachgebildet und simuliert werden.1

Bei Zeit und Lust werde ich mich daran machen.

Fazit

Der p-Wert von statistischen Tests gibt an wie wahrscheinlich eine Stichprobe (Experiment, Versuch, …) unter Annahme einer Verteilung ist. Er zeigt, ob eine Stichprobe zufällig oder überzufällig ist. Die statistische Signifikanz sagt nichts über die (nicht-statistische) Signifikanz. In anderen Worten, die statistische Signifikanz sagt nicht wie relevant eine Ergebnis ist.


  1. Die Nachbildung einer echten wissenschaftlichen Studie ist möglich, da in der Wissenschaft die Methoden angegeben werden. Also auch, welche statistischen Verfahren benutzt wurden. 

Statistische Signifikanz (p-Wert) in Studien (mit Simulator)

Was bedeutet signifikant? Was bedeutet statistisch signifikant? Was bedeutend der statistische p-Wert? Warum wird der p-Wert eingesetzt?

Statistik ist ein wesentlicher Teil empirischer, wissenschaftlicher Studien. Kenntnisse in Statistik sind notwendig.

Ich hatte einmal etwas Statistik, doch das ist schon länger her. Zur Auffrischung und zum Erklären habe ich diesen Artikel mit einem kleinen Statistik-Simulator geschrieben. Der Simulator soll zum Ausprobieren animieren. Beim Artikel stand nicht die mathematische Präzision im Vordergrund, sondern das intuitive Verständnis.

Die mathematischen Symbole und der Simulator werden dynamischen (mit JavaScript) erstellt. Aus diesem Grund wird der Artikel in RSS-Feeds und versandten E-Mails nicht vollständig angezeigt und ausführbar sein. Der Simulator funktioniert im Web-Browser.

Münz-Beispiel

Der Simulator stellt ein kleines Beispiel dar. Wir simulieren eine Münze. $0$ ist Kopf. $1$ ist Zahl. Die Stichprobe (Beobachtung, Datenerhebung) besteht aus $n$ Würfen.

Wir können uns nun fragen, ob die Münze fair ist, ob Kopf und Zahl gleich wahrscheinlich sind oder ob eine der beiden Seiten wahrscheinlicher ist. Ähnlich der Frage, ob Behandlungserfolge zufällig sind oder auf die Wirkung der Behandlung zurückgehen.

Statistische Tests

Bei Stichproben aus Datenerhebungen stellt sich die Frage, ob die Stichprobe „ein Muster“ zeigt oder, ob die Stichprobe im Rahmen des Zufalls ist. Um diese Frage zu beantworten gibt es statistische Tests. Je nach Problemfeld und erhobenen Daten kommen verschiedene Tests zum Einsatz.

Mathematik ist eine Sprache und ein Werkzeug. Um das Problem statistisch bearbeiten zu können, müssen wir es übersetzen. Um die spätere Bearbeitung zu erleichtern wird es in eine bestimmte Form gebracht.

Die zu überprüfende Hypothese, dass Kopf und Zahl gleich wahrscheinlich sind, wird als Nullhypothese $H_0$ bezeichnet. Die gegenteilige Hypothese wird als Alternativhypothese $H_1$ bezeichnet.

$H_0$: Die Wahrscheinlichkeit $p$ für Kopf ist gleich der Wahrscheinlichkeit für Zahl, oder formal $p = 1/2$.

$H_1$: Die Wahrscheinlichkeiten sind unterschiedlich. Es gilt also: $p \ne 1/2$.

Ja/Nein, $0/1$ Experimente sind binominalverteilt. Sie gehorchen der Binominalverteilung.

Im statistischen Test wird nun geprüft wie wahrscheinlich eine Stichprobe bei einer Binominalverteilung ist. Es wird der p-Wert der Stichprobe bestimmt. Ein zuvor festgelegter Signifikanzschwellwert $\alpha$, typischerweise $0.05$, sagt ab welchem p-Wert die Nullhypothese verworfen wird. Falls die Wahrscheinlichkeit der Stichprobe kleiner als dieser Signifikanzschwellwert ist, wird die Nullhypothese verworfen und die Alternativhypothese angenommen.

Kompakter geschrieben:

$H_0$: $p = p_0$

$H_1$: $p \ne p_0$ (bei zweiseitiger Fragestellung)

Unter der Nullhypothese ist die Stichprobe binomialverteilt mit dem Erwartungswert $n p_0$.

Es gibt verschiedene statistische Tests um binominalverteilte Stichproben zu prüfen.

  • Binominaltest für eine Stichprobe
    • Binominaltestnäherung für eine hinreichend grosse Stichprobengrösse
  • Chi2-Test für eine Stichprobe mit einem 2-fach gestuften Merkmal

Simulator

Ich habe für die oben beschriebenes Münzbeispiel einen Simulator geschrieben. $0$ ist Kopf, $1$ ist Zahl. $p_0$ ist die gegebene Wahrscheinlichkeit für Kopf. Diesen Wert wollen wir statistisch überprüfen. Im Simulator kann $p_0$ mit einem Schieberegler eingestellt werden.

Die Grösse einer Stichprobe kann mit dem Schieberegler $n$ eingestellt werden. Eine Stichprobe entspricht einem Experiment. Dies könnte in der Realität einer Studie entsprechen.

Im Simulator ist es leicht viele Wiederholungen des Experimentes zu machen und viele Stichproben auswerten zu können.

Mit dem Simulator kann gespielt und intuitiv ausprobiert werden.

Interessante Szenarien sind:

  • Wie viele falsche signifikante Ergebnisse gibt es? Wie häufig wird die Nullhypothese verworfen bei $p_0 = 1/2$, also eine fairer Münze, wo die Nullhypothese gilt? (Mit Parameter Anzahl Läufe $m$ spielen.)
    • Wie abhängig ist die Anzahl signifikanter Ergebnisse von der Stichprobengrösse? (Mit Parameter $n$ spielen, beispielsweise $n = 40$ oder $n = 100$.)
  • Wie unfair muss eine Münze sein, damit die Nullhypothese verworfen wird, also ein signifikantes Ergebnis erzielt wird. ($p_0$ auf $0.51$, $0.6$ und $0.7$ setzen). Wie aggressiv wird $H_0$ verworfen?
    • Gleichzeitig kann der Einfluss der Stichprobengrösse untersucht werden. (Mit Parameter $n$ spielen, beispielsweise $n = 40$ oder $100$.)

Viel Spass beim Simulieren!

Beobachtungen

Wir sehen, dass für eine recht unfaire Münze (Bsp. $p_0 = 0.66$) genügen schon wenige Stichproben (Bsp. $n = 20$), um eine statistisch zuverlässige Aussage mit tiefem p-Wert zu erhalten. (Kontrolle mit $m = 100$).

Umgekehrt kann für eine kleine Unfairness (Bsp. $p_0 = 0.51$) mit einer grossen Stichprobe (Bsp. $n = 1000$) ein signifikantes Ergebnis mit (p-Wert $< 0.05$) erreicht werden. (Kontrolle mit $m = 100$).

Die statistische Signifikanz sagt nichts über die Relevanz eines Ergebnisses. Die Signifikanz bzw. Relevanz kann nicht von der statistischen Signifikanz abgeleitet werden. Die statistische Signifikanz gibt nur eine Antwort, ob ein Resultat zufällig oder überzufällig ist.

Da es sich um ein mathematisches Modell handelt, könnte man sich für $0$ auch eine Geburt eines Knaben denken und für $1$ die Geburt eines Mädchens. Das wird mit diesem $0/1$ Modell genauso abgebildet. Gibt es statistisch mehr Geburten eines Geschlechts? Mehr Knaben, mehr Mädchen?

Literaturangaben

Für die Erstellung dieses Artikels habe ich Wikipedia (p-Wert, Binomialtest, Chi-Quadrat) und das Buch Basiswissen Medizinische Statistik, Christel Weiß, 5., überarbeitete Auflage. Springer, 2010 benutzt.

Quellcode

Im Sinne von Open Source ist hier der Simulator abrufbar: p-Wert 1 Stichproben Simulator.js

Als Statistik-Hilfsprogramm habe ich jstat verwendet. Die wunderschöne mathematische Darstellung erstelle ich mit MathJAX. Die Simulatorbenutzeroberfläche habe ich mit jQuery und jQuery UI gemacht.

Ausblick

Im vorliegenden Simulator habe ich den einfachst möglichen Simulator erstellt. Kopf/Zahl werden mit $0/1$ abgebildet. Das Prinzip kann demonstriert werden. Auf die Thematik von ein- und zweiseitigen Tests bin ich nicht eingegangen.

Der Simulator kann noch erweitert werden:

  1. Wie in klinischen Studien üblich, kann eine Kontrollgruppe (z.B. mit Placebo) einbezogen werden.
  2. Die Statistik einer echten, grossen Studie könnte nachgebildet und simuliert werden.1

Bei Zeit und Lust werde ich mich daran machen.

Fazit

Der p-Wert von statistischen Tests gibt an wie wahrscheinlich eine Stichprobe (Experiment, Versuch, …) unter Annahme einer Verteilung ist. Er zeigt, ob eine Stichprobe zufällig oder überzufällig ist. Die statistische Signifikanz sagt nichts über die (nicht-statistische) Signifikanz. In anderen Worten, die statistische Signifikanz sagt nicht wie relevant eine Ergebnis ist.


  1. Die Nachbildung einer echten wissenschaftlichen Studie ist möglich, da in der Wissenschaft die Methoden angegeben werden. Also auch, welche statistischen Verfahren benutzt wurden.