Die Datenkrise des Robert-Koch-Instituts<br>

Die Datenkrise des Robert-Koch-Instituts

Das RKI veröffentlicht viele spannende Daten, die die Corona-Pandemie in neuem Licht erscheinen lassen. Man muss sie nur suchen.

15.07.2020, Autor: Klaus Lindinger

Wer sich einer Aufarbeitung des „heißen Eisens“ Coronavirus SARS-CoV-2 nähert, gerät schnell zwischen die Fronten der Befürworter und Kritiker des Krisenmanagements der Bundesregierung. Zentral bei der Bewertung der Gefährlichkeit des Virus und den zu treffenden Maßnahmen war das Robert-Koch-Institut (RKI) und dessen Zahlen.

Ich habe zum einen eine pflegebedürftige 90-jährige Mutter und eine 85-jährige Schwiegermutter, die beide zur oft thematisierten Risikogruppe zählen und deren Verunsicherung mein tiefergehendes Interesse an diesem Thema geweckt haben. Zum anderen habe ich 32 Jahre Berufserfahrung mit Datenanalyse-Software und deren Vermarktung. “Big Data“ war und ist ein zentrales Thema unserer Branche. Womöglich bekommt man so ein gewisses Gefühl für größere Zahlenwerke.

Deshalb erschien mir die Aufbereitung und Darstellung der Daten zum Corona-Infektionsgeschehen in Deutschland durch das RKI von Anfang an nur in Teilen plausibel. Denn in den Lageberichten des RKI schlummern viele Daten, die von großer Relevanz sind. Nur werden diese Daten nicht oder nur unzureichend in Zusammenhang mit den  SARS-CoV-2 Fallzahlen und Todesfällen gebracht.

Warum das so ist, kann nur spekuliert werden. Auf Basis meiner langjährigen Erfahrung mit Systemen für Datenanalyse und Datenmanagement würde ich vermuten, dass man intern einfach keinen Überblick über die vielen verschiedenen Datenquellen hat und es eventuell keine Datenharmonisierung oder -abgleiche gibt. Dazu kommt sicherlich die große Beanspruchung der RKI-Ressourcen im Zuge der Corona-Pandemie.

Abbildung 1: Kulmulierte Fallzahlen (Quelle: Robert-Koch-institut)


1. Das Problem mit den absoluten Fallzahlen

  • Fokussierung auf absolute Fallzahlen führt zu einer irreführenden Darstellung des Infektionsgeschehens.

  • Entscheidender Kontext fehlt:
    o    Anzahl der getesteten Menschen + Relation Getestete / positive  SARS-CoV-2-Fälle
    o    Genesene und Verstorbene werden generell nicht von der Gesamtanzahl der positiv Getesteten abgezogen („inzwischen fast 200.000 Infizierte in Deutschland“) was zu einer Wahrnehmungsverzerrung führt.
    o    Keine Unterscheidung zwischen Infizierten, Erkrankten und Hospitalisierten.
    o    Fehlende Relation im Vergleich zu anderen Krankheiten, damit eine sachliche Gefahreneinschätzung möglich wird

Was mich von Anfang an störte, war die reine Fokussierung - sowohl von RKI als auch der Leitmedien - auf kumulierte Fallzahlen sowie die Darstellung optisch exponentiell steigender Infektionskurven (siehe Abbildung 1). Der hier extrem wichtige Kontext, nämlich die Anzahl der “aktiven“ positiv getesteten Menschen - das sind die verbleibenden potentiell infektiösen Menschen, wenn man die Genesenen und Verstorbenen von der Gesamtanzahl der positiv getesteten Menschen abzieht – wurde aber vor allem in den ersten Wochen fast komplett ausgeblendet.

Nachdem immer mehr Menschen Unmut über die Kommunikation des RKI äußerten, führte man vermutlich als Reaktion zunächst die „Verdopplungsrate der neu-positiven Fälle in Tagen“ als Kennzahl ein, änderte die Zielgröße für „Lockerungen“ schnell von zehn auf 14 Tage, um dann kurz danach den „R-Wert“ einzuführen, mit dem verbundenen Ziel, dieser müsse unter „1“ gehalten werden.

Ich habe die Berichterstattung täglich verfolgt und war auch nicht überrascht, als das RKI am 17. März nach den erschreckenden Geschehnissen in Norditalien und zwölf registrierten Todesfällen in Deutschland seine  Risikoeinschätzung auf “hoch“ stufte. Viel mehr verwunderte mich infolgedessen die Darstellung der Infektionszahlen im RKI-Dashboard. Hier werden die Covid19-Fallzahlen Tag um Tag aufaddiert. Diese Kurve flachte rein optisch erst Mitte April leicht ab. Der Eindruck entsprach aber in keiner Weise der Realität, denn der Tag mit der höchsten Fallzahl von 6.294 neuen positiv Getesteten, war schon am 28. März erreicht (siehe Abbildung 2). Auch bis zu diesem Tag gab es nie eine anhaltend exponentielle Entwicklung der Infektionen und schon Mitte April halbierten sich die neuen  SARS-CoV-2 Fälle auf weniger als die Hälfte, durchschnittlich 2.800 pro Tag.


SARS-CoV-2-Fallzahlen ohne Relation und Kontext

Ein entscheidender Faktor, der weiterhin bei fast allen Datenvisualisierungen zum Infektionsgeschehen außer Betracht gelassen wird, ist die Population, auf die sich die Anzahl der positiv getesteten Menschen bezieht. Diese Population ist nicht statisch, denn sie ist primär davon abhängig, wie viele Menschen täglich getestet werden. Das Testvolumen der Labore wird nur in Wochenzyklen gemeldet. Es lag bis zu den ersten Meldungen in Kalenderwoche 10 und 11 Anfang März jeweils bei etwas weniger als 130.000 Testungen. Mit 957 positiv Getesteten im Zeitraum vom 3. bis zum 9. März, also der Woche vor KW 11, lag deren Anteil innerhalb der Testpopulation bei lediglich 0,75%.

In der darauffolgenden Woche wurde das Testvolumen auf 348.619 weit mehr als verdoppelt. Gleichzeitig verfünffachte sich die absolute Anzahl der positiv Getesteten auf 4.873 Menschen. Der Anteil der positiv getesteten Menschen innerhalb der Testpopulation ist jedoch nur von 0,75% auf 1,4% gestiegen. Dies bedeutet, dass unter Berücksichtigung der wesentlich größeren Testpopulation lediglich eine Verdopplung und keine Verfünffachung der Fallzahlen erfolgte. Dies entspräche damals schon einer sehr viel flacheren Steigerungsrate und nicht eine von aufaddierten Fallzahlen suggerierte Steilkurve.

Schauen wir nun auf die aktuellen Zahlen, so weist das RKI von Beginn der Erfassungen bis zum 13. Juli kumulativ 198.963 positiv getestete SARS-CoV-2Fälle aus. Interessant ist, dass bis zur Kalenderwoche 21 auch 193.596 Influenza-Fälle ermittelt wurden (RKI, Epidemiologisches Bulletin 24/2020 - Seite 11).
Subtrahiert man nun von den bislang ermittelten  SARS-CoV-2 Fällen die 185.100 kumulativ ausgewiesenen Genesenen und die 8.064 Verstorbenen der bestätigten Fälle, dann verbleiben lediglich noch 4.799 „aktive“ Fälle. Die einzige mir bekannte Quelle, die diese Sicht auf die  SARS-CoV-2 Daten von Beginn an bis zuletzt am 9. Juni in einem internationalen Vergleich in einer Infografik darstellt, war bei Statista zu finden (siehe Abbildung 3).

Abbildung 2: Neue Fälle nach Meldedatum (Quelle: Robert-Koch-institut)

Abbildung 3: Verhältnis Infizierte/Genesene (Quelle: Statista)


2. Das Problem mit den falsch-positiven Tests

Das Problem mit falsch-positiven Tests ist inzwischen bekannt. Man muss sich bewusst sein, dass es sich bei jedem positiven Test um nicht-infektiöse Virenfragmente, eine asymptomatische Infektion oder eben um ein falsch-positives Resultat handeln kann. Nicht jeder  SARS-CoV-2-Positive ist "erkrankt".

In den Worten von Gesundheitsminister Jens Spahn:

Click here to play the video.

3. Das Problem mit der Dunkelziffer

Kommen wir nochmals zurück zur Bezugsgröße der Testpopulation. Die zuletzt vom RKI veröffentlichten Testzahlen in der Kalenderwoche 27 (also vom 29. Juni bis zum 7. Juli) lagen bei 494.146 Testungen und insgesamt 2.836 positiv Getesteten. Dies bedeutet (auch unter Berücksichtigung von Mehrfachtestungen) einen Anteil von lediglich 0,7% (oder 7 von 1.000 Personen) innerhalb der getesteten Population von knapp einer halben Million Menschen und mit 55 verstorbenen Menschen in diesem Zeitraum, sind dies 0,01% der getesteten Menschen (siehe Abbildung 4).

Laut RKI wurden bis zur ersten Juliwoche insgesamt 6,4 Millionen Testungen durchgeführt, somit wurde zwischenzeitlich etwa jeder 20-zigste oder umgerechnet etwas mehr als 6,5% der 83 Millionen Einwohner Deutschlands auf SARS-CoV-2 getestet. Bis zum 13. Juli 2020 sind insgesamt 9.064 der 5½ Millionen mit Verdacht auf SARS-CoV-2 getesteten Menschen verstorben, das ist ein Anteil von umgerechnet 0,16% der getesteten Population.

Die Quintessenz: eine statistische Einbeziehung der wöchentlich vom RKI veröffentlichten Testpopulationen, welche den rechnerischen Nenner der positiv Getesteten darstellt, hätte schon im März erkennen lassen müssen, dass wir in Deutschland keine explosionsartige SARS-Epidemie bekommen werden und eine bundesweite Ausgangssperre in dieser Form ganz sicher nicht erforderlich gewesen wäre.

Rechnet man die 4.799 aktiven Fälle von der Test-Population (ca. 5 1/2 Millionen) auf die amtliche Einwohnerzahl von 83,02 Millionen hoch, verbleiben in Deutschland insgesamt weniger als 7.500 infektiöse SARS-CoV-2 Fälle. Diese errechnete “Dunkelziffer“ ist auf Basis der Erkenntnisse einer Modellierungsstudie von Endo et al. stützt diese Annahme. Basierend auf den Daten der WHO-Länderberichte wurde geschätzt, dass mit einem median k von 0,1 (95 %-KI: 0.05–0.2) von nur etwa 10 % infektiöser Indexfälle 80 % der Folgefälle ausgehen.

Ein gutes Beispiel, wie schwierig die Einschätzung der Dunkelziffer der tatsächlichen „Durchseuchung“ ist, zeigen zwei Studien: im „Epizentrum“ Ischgl haben mehr als 42% aller Einwohner Antikörper, 85% bemerkten von einer Infektion gar nichts und nur 2 Personen sind mit einem positiven SARS-CoV-2-Testergebnis verstorben. In Deutschland hat eine erste Antikörperstudie hingegen einen Wert von 1,3% Durchseuchung ermittelt. Dass immer noch keine umfangreichen repräsentativen Studien (Reihentests) zur Durchseuchung der Bevölkerung abgeschlossen wurden - wir befinden uns immerhin in Monat fünf der Pandemie - ist aus meiner Sicht ein großes Versäumnis.

Abbildung 4: Reality-Check - Tatsächliche Verteilung von Getesteten, Negativen, Laborbestätigten und Todesfällen. Ab März starker Rückgang. (Quellen: RKI, Klaus Lindinger)

4. Das Problem mit der Zweideutigkeit von SARS-CoV-2 als Todesursache

Laut Definition des Robert-Koch-Instituts wäre George Floyd ein Opfer von SARS-CoV-2 und würde in der entsprechenden Statistik so ausgewiesen werden. Dies fasst die unseriöse Zählweise prägnant zusammen. Außerdem werden einmal positiv Getestete auch nach vollständiger Genesung und dann späterem Ableben mit in die Statistik der Toten aufgenommen, wie in dem aktuellen Fall in Krefeld (siehe 6. Juli):

"Obwohl es laut Feststellung des städtischen Fachbereichs Gesundheit keinen neuen Todesfall im Zusammenhang mit SARS-CoV-2 zu verzeichnen gibt, muss die Zahl der Verstorbenen systemrelevant um einen Fall auf nun 23 heraufgesetzt werden, um die Statistik an die des Robert-Koch-Institutes anzupassen. Grund ist, dass Personen, die einmal positiv auf das Coronavirus getestet wurden und später versterben grundsätzlich in dieser Statistik aufgeführt werden. Im vorliegenden Krefelder Todesfall galt die Person (mittleren Alters und mit multiplen Vorerkrankungen) nachdem es mehrfach negative Testergebnisse gab inzwischen seit längerem als genesen."

Aus wissenschaftlicher Sicht sind damit alle Zahlen zu „Coronatoten“ in Frage zu stellen bzw. nicht eindeutig. Solange es keine Evidenz gibt, kann man aus der Zahl der SARS-CoV-2 Todesopfer keine klaren Schlussfolgerungen ziehen.

Dass das RKI anfangs vom Obduzieren abriet, wirft Fragen auf. Entgegen des RKI-Rates durchgeführte Obduktionen zeigten dann, dass alle mit SARS-CoV-2-Verstorbenen an anderen Vorerkrankungen litten und nach Aussage des obduzierenden Professors für Rechtsmedizin Klaus Püschel der Tod unabhängig von SARS-CoV-2 bald eingetreten wäre (siehe Video 2).

Etwa 70% der erfassten Fälle enthalten die Angabe des Test-Orts. In diesem Zeitraum sind lediglich 125 = 11% aller SARS-CoV-2 Fälle im Krankenhaus verstorben. Außerdem gibt es große Unterschiede zu den Angaben der Verstorbenen, die aus dem DIVI-Intensivregister der Krankenhäuser in den täglichen Lageberichten des RKI nachzuverfolgen sind. Im Vergleichszeitraum sind dort angeblich 309, also fast dreimal so viele Menschen auf Basis einer offensichtlich stark differierenden Erhebungsweise in Krankenhäusern verstorben. Erklärungen für diese massiven Unterschiede waren für mich bislang nicht gegeben.

Erst seit dem 23. April führt das RKI den Erfassungsort “Pflegeheim“ in seinen täglichen Lageberichten auf. Im Zeitraum bis zum 15. Mai, also dem Tag vor dem Höhepunkt der täglichen Todesfälle, wurden insgesamt 2.945 COVID-19 Todesfälle gemeldet, wovon 1.371 = 46,5% mit SARS-CoV-2 Verstorbene in Pflegeheimen und 255 = 8,7% in Krankenhäusern registriert wurden. Hieraus kann durchaus geschlussfolgert werden, dass der Schwerpunkt der Testungen kontinuierlich auf Pflegeheime hin ausgeweitet wurde. Das DIVI-Register weist in diesem Zeitraum 1.294 = 44% mit SARS-CoV-2 Verstorbene aus.

Click here to play the video.

Video 2: Professor Klaus Püschel in der Tagesschau zu den Obduktionsergebnissen von COVID19-Positiven.

5. SARS-CoV-2 und Übersterblichkeit – Korrelation ja, Kausalität nein

Natürlich kann man die Ergebnisse aus Studien wie beispielweise in Ischgl (siehe oben) nicht verallgemeinern, zu speziell sind immer die örtlichen Umstände und die Dynamik des Ausbruchsgeschehens. Aber genau so wenig kann man aus den Zuständen in Norditalien oder New York Rückschlüsse auf das Pandemiegeschehen in Deutschland ziehen.

Die gravierenden Unterschiede im Infektionsgeschehen und bei der Übersterblichkeit zwischen beispielsweise Deutschland und Italien oder Portugal und Spanien lassen sich nicht alleine mit SARS-CoV-2 erklären. Es müssen hier lokale Gegebenheiten wie Schwächen der Gesundheitssysteme oder die Luftverschmutzung massiven Einfluss auf das Pandemie- und Sterblichkeitsgeschehen gehabt haben. So ist im EUROMOMO in vielen Ländern eine eindeutige zeitliche Korrelation zwischen Ausgangssperren im März /April und einer Übersterblichkeit zu erkennen. Ob diese Übersterblichkeit durch SARS-CoV-2 verursacht wurde, kann man da jedoch nicht herauslesen. Oft haben wir in letzter Zeit den Satz „Ein Virus kennt keine Grenzen“ gehört – die Auswirkungen der Pandemie sind lokal jedoch sehr unterschiedlich.


Eindimensionale Daten führen andernorts zu Opfern

Auch wenn nicht absehbar ist, dass die Pandemie in Deutschland zu einer Übersterblichkeit führt, so ist sie doch für alle Beteiligten kein Pappenstiel. Aus den unterschiedlichsten Quellen strömen kontinuierlich Daten auf das RKI ein. Wenn die Daten allerdings nicht in Einklang gebracht werden, so kann dies zu erheblichen Konsequenzen führen.

Wir sollten uns bewusst sein, dass die Statistiken und täglichen Beurteilungen des Robert-Koch-Instituts auch zur Verschiebung von über 50.000 Krebsoperationen geführt haben. Das Ärzteblatt schreibt dazu am 15. Mai: „28 Millionen chirurgische Eingriffe weltweit aufgrund von SARS-CoV-2 verschoben.“ Darunter sind laut CovidSurg 908.759 aufgeschobenen Operationen für Deutschland, inklusive rund 850.000 elektive (oder gutartig genannte) Eingriffe. Das sind 85 % aller elektiven Operationen. Außerdem sind 52.000 Krebsoperationen aufgeschoben worden, somit 24 % aller Eingriffe bei malignen Erkrankungen.

Abbildung 5: Vergleich der Verteilung der SARS-CoV-2-Todesopfer nach Altersgruppe mit der Normalverteilung von Vertorbenen in Deutschland (Quellen: RKI / Statistisches Bundesamt)

Weitere Kollateralschäden


Wir können viel lernen

Auch wenn die Zahlen aus meiner Sicht eine klare Sprache sprechen: die Geschehnisse können nicht mehr revidiert werden und ich möchte hier auch niemanden verurteilen. Wir können aber sehr viel für die Zukunft lernen und gerade in einer solch bedrohlichen Situation täglich neu eruieren, ob an den neuralgischen Punkten tatsächlich Engpässe auftreten und wie sich ein neuer Krankheitserreger im Vergleich zu bekannten Virenstämmen verhält. Und es wäre wünschenswert, wenn dann weniger Fokus auf spektakuläre Einzelfälle und Brandherde und mehr auf alle Bevölkerungsschichten gelegt würde.

Wenn Ihnen an der weiteren Aufklärung des Geschehens gelegen ist, dann können Sie über die beim Bundestag einberufene Petition 109562 die Einberufung einer Expertenkommission mit Befürwortern und Kritikern der Maßnahmen der Regierung im Zuge der Corona-Pandemie unterstützen. Nur der offene Dialog kann uns als Gesellschaft von dieser Krise lernen lassen.