Corona
Forscher findet gelöschte Dateien: Zirkulierte das Virus schon vor Dezember 2019?

Ein US-Forscher hat in der Google Cloud 13 gelöschte Sequenzierungen des Coronavirus gefunden. Sie stammen aus Wuhan und befeuern die These, dass das Virus bereits vor dem Ausbruch auf dem Wildtiermarkt in Wuhan im Umlauf war.

watson (saw/dfr)
Merken
Drucken
Teilen
Vor etwa einem Jahr verschwanden genetische Sequenzierungen von mehr als 200 Virusproben aus frühen Fällen von Covid-19 in Wuhan aus einer wissenschaftlichen Online-Datenbank. (Symbolbild)

Vor etwa einem Jahr verschwanden genetische Sequenzierungen von mehr als 200 Virusproben aus frühen Fällen von Covid-19 in Wuhan aus einer wissenschaftlichen Online-Datenbank. (Symbolbild)

EPA ANSA / Keystone

Die Debatte über die Ursprünge des Coronavirus sind in jüngster Zeit wieder aufgeflammt. Die US-Regierung hat eine Untersuchung dazu eingeleitet, als Stimmen laut wurden, dass das Virus nicht von Fledermäusen auf den Menschen übertragen wurde, sondern aus einem Labor in Wuhan stammt. Bis anhin galt der Wildtiermarkt in Wuhan als Ursprungsort des Coronavirus. Hier soll das Virus vom Tier auf den Mensch übergesprungen sein.

Neue Studie: Wurde das Virus schon früher auf den Menschen übertragen?

Eine neue Studie des US-Virologen Jesse Bloom bestätigt weder die eine noch die andere These. Sie stellt jedoch infrage, ob das Coronavirus wirklich erst auf dem Wildtiermarkt in Wuhan seinen Weg zum Menschen gefunden hat. Die Studie wurde bislang nicht peer-reviewed oder in einem Wissenschaftsmagazin veröffentlicht.

Der Grund dafür ist folgender: Vor etwa einem Jahr verschwanden genetische Sequenzierungen von mehr als 200 Virusproben aus frühen Fällen von Covid-19 in Wuhan aus einer wissenschaftlichen Online-Datenbank. Dies berichtet die «New York Times».

Jesse Bloom entdeckte dies, als er im Internet auf eine Studie vom März 2020 stiess. Diese beinhaltete eine Tabelle mit über 241 genetischen Sequenzierungen, die von Wissenschaftlern der Universität Wuhan gesammelt worden waren. Die Tabelle zeigte an, dass die Wissenschaftler die Sequenzierungen in einer Online-Datenbank namens «Sequence Read Archive» hochgeladen hatten, die von der National Library of Medicine der US-Regierung verwaltet wird.

Wertvolle Sequenzen nicht mehr auffindbar

Solche genetischen Sequenzierungen sind wichtig, da sie Hinweise darauf enthalten, wie SARS-CoV-2 von einem anderen Tier auf unsere Spezies übergesprungen ist. Besonders wertvoll gelten dabei Sequenzen aus den frühen Phasen der Pandemie, da sie die Forschenden näher an diesen «Spillover-Moment» heranführen.

Aus diesem Grund war auch Bloom an diesen Sequenzen interessiert – als er aber auf der Datenbank nach ihnen suchte, waren sie nicht auffindbar. Als er in der Tabelle nachschaute, wer die verschwundenen Sequenzierungen vorgenommen hatte, stiess er auf Dr. Aisi Fu, Mitbegründer eines klinischen Labors in Wuhan, das sich mit Sequenzierungs-Technologie befasst.

Mitglieder der WHO bei der Ankunft an einer Ausstellung über den Kampf gegen Corona in Wuhan. Das Team reiste in die Stadt, um die Herkunft von SARS-Cov-2 genauer zu erforschen. (30. Januar 2021)

Mitglieder der WHO bei der Ankunft an einer Ausstellung über den Kampf gegen Corona in Wuhan. Das Team reiste in die Stadt, um die Herkunft von SARS-Cov-2 genauer zu erforschen. (30. Januar 2021)

AP / Keystone

Fund könnte neue Erkenntnisse in der Rückverfolgung des Virus liefern

Entschlossen, die Sequenzen zu finden, stiess Bloom auf eine weitere Studie Fus, die im März 2020 veröffentlicht wurde. Darin untersuchten die Wissenschaftler 45 Nasenabstriche, die zu Beginn der Pandemie entnommen wurden, um nach dem genetischen Material von SARS-CoV-2 zu forschen.

Die Wissenschaftler veröffentlichten allerdings nicht die tatsächlichen Sequenzen, sondern nur einige Virus-Mutationen. Dennoch entdeckte Bloom Hinweise darauf, dass es sich bei den Nasenabstrichen um die Quelle der 241 verschwundenen Sequenzen handeln musste.

Nach einer weiteren Recherche entdeckte er 13 der Sequenzen als einzelne Dateien in der Google Cloud. Der Fund ist bedeutend, da er neue Erkenntnisse in der Rückverfolgung des Virus liefern könnte. Weil es aus der frühen Phase der Pandemie nur eine limitierte Anzahl Proben gibt, ist jede einzelne besonders wertvoll. Einige der frühsten Proben stammen vom Huanan-Wildtiermarkt in Wuhan, wo im Dezember 2019 ein Corona-Ausbruch stattgefunden hat.

Verdacht, dass das Virus bereits früher in Wuhan zirkulierte

Diese Markt-Viren haben allerdings drei zusätzliche Mutationen, die in SARS-Cov-2-Proben fehlen, die wenige Wochen später gesammelt wurden. Die später gefunden ähnelten viel mehr den Corona-Viren, welche in Fledermäusen nachgewiesen wurden. Aus diesem Grund wäre es möglich, dass eine frühe Abstammungslinie des Virus nicht durch den Markt geführt hat.

Auch die jetzt wieder gefundenen Sequenzen aus der Google Cloud ähnelten mehr den Fledermaus-Coronaviren. Dies legt nahe, dass das SARS-CoV-2 in Wuhan bereits eine Weile zirkulierte, bevor es den Wildtiermarkt erreichte, so Bloom. Somit würde das Markt-Virus nicht alle Coronaviren repräsentieren, die im späten 2019 bereits im Umlauf waren.

EInige Corona-Viren wurden in Fledermäusen nachgewiesen. Im Bild: Eine Doktorandin entnimmt Proben einer Fledermaus zur Untersuchung auf verschiedene Viren. (16. Juni 2021)

EInige Corona-Viren wurden in Fledermäusen nachgewiesen. Im Bild: Eine Doktorandin entnimmt Proben einer Fledermaus zur Untersuchung auf verschiedene Viren. (16. Juni 2021)

Keystone/
Ennio Leanza

Grund für die Löschung der Daten unklar

Weshalb diese Sequenzierungen aus der Datenbank gelöscht wurden, sorgt noch immer für Fragezeichen, auch wenn der Prozess anscheinend regelkonform verlaufen ist: Wissenschaftlerinnen und Wissenschaftler können das Löschen von Daten beantragen, indem sie sich bei den Managern der Datenbank von Sequence Read Archive melden. Die «National Library of Medicine», welche das Archiv verwaltet, bestätigt, dass sie letzten Sommer 13 Sequenzen entfernt hatten.

Die SARS-CoV-2-Sequenzen seien im März 2020 zur Veröffentlichung im Sequence Read Archive eingereicht und anschliessend im Juni 2020 von derselben Person wieder zurückgezogen worden, so eine Sprecherin der «National Library of Medicine». Der Rückzug sei damit begründet worden, dass die Sequenzen aktualisiert und in eine andere Datenbank integriert würden.

Bloom hat daraufhin jede ihm bekannte Datenbank durchforstet, ohne jedoch die Sequenzen zu finden. Ob die Sequenzen nun tatsächlich auf einer anderen Datenbank abgespeichert sind oder ob ihr Verschwinden dubiose Hintergründe hat, bleibt zurzeit ungeklärt. Die «New York Times» konnte keinen der involvierten Forschenden der Studie erreichen.