Sequências excluídas do genoma do coronavírus desencadeiam intriga científica
Seqüências parciais de SARS-CoV-2 dos primeiros surtos em Wuhan foram removidas de um banco de dados do governo dos Estados Unidos pelos cientistas que as depositaram
Cientistas pedem compartilhamento totalmente aberto de dados do genoma do coronavírus
Os esforços para estudar os estágios iniciais da pandemia do coronavírus receberam ajuda de uma fonte surpreendente. Um biólogo nos Estados Unidos "escavou" sequências parciais do genoma SARS-CoV-2 do início do provável epicentro da pandemia em Wuhan, China, que foram depositadas - mas posteriormente removidas - de um banco de dados do governo dos Estados Unidos.
As sequências parciais do genoma abordam um enigma evolutivo sobre a diversidade genética inicial do coronavírus SARS-CoV-2, embora os cientistas enfatizem que eles não lançam luz sobre suas origens. Tampouco está totalmente claro por que os pesquisadores da Wuhan University solicitaram que as sequências fossem removidas do Sequence Read Archive (SRA), um repositório de dados de sequenciamento bruto mantido pelo National Center for Biotechnology Information (NCBI), parte dos Institutos Nacionais dos EUA da Saúde (NIH).
“Essas sequências são informativas, não são transformadoras”, diz Jesse Bloom, um geneticista evolucionário viral no Fred Hutchinson Cancer Research Center em Seattle, Washington, que descreve em uma pré-impressão de 22 de junho como ele recuperou as sequências .
Bloom descobriu as sequências depois de pesquisar dados genômicos dos estágios iniciais da pandemia. Um artigo de pesquisa de maio de 2020 continha uma tabela de dados de sequência publicamente disponíveis, que incluía entradas que Bloom não encontrou . As sequências foram associadas a um artigo, que aplicou uma tecnologia conhecida como sequenciamento nanopore para detectar material genético SARS-CoV-2 em amostras de pessoas. Esse estudo foi publicado na revista Small em junho de 2020 , tendo sido postado no bioRxiv em março daquele ano .
Quando Bloom procurou as sequências no SRA usando os detalhes listados no artigo de maio de 2020, o banco de dados não retornou nenhuma entrada. A SRA mantém sequências em armazenamento em nuvem mantido pelo Google, e Bloom se perguntou se ele poderia encontrar versões arquivadas das sequências em servidores em nuvem. Esta abordagem funcionou, e Bloom foi capaz de recuperar dados de 50 amostras, 13 das quais continham dados brutos suficientes para gerar sequências parciais do genoma.
Mistério evolucionário
As sequências ajudam a resolver um mistério evolutivo sobre os estágios iniciais da pandemia, diz Bloom. As primeiras sequências virais de Wuhan são de indivíduos ligados ao Huanan Seafood Market da cidade em dezembro de 2019, que inicialmente se pensava ser o local onde o coronavírus saltou dos animais para as pessoas. Mas as sequências do mercado de frutos do mar estão mais distantemente relacionadas aos parentes mais próximos do SARS-CoV-2 em morcegos - a origem mais provável do vírus - do que sequências posteriores, incluindo uma coletada nos Estados Unidos.
Isso foi surpreendente, diz Bloom, porque era de se esperar que os vírus dos estágios iniciais da epidemia de Wuhan estivessem mais intimamente relacionados aos parentes infectantes de morcegos do SARS-CoV-2. As sequências recuperadas, que provavelmente foram coletadas em janeiro e fevereiro de 2020, mostram que é esse o caso - elas estão mais intimamente relacionadas aos vírus de morcego do que as sequências de pessoas ligadas ao mercado de frutos do mar.
Isso se soma a um crescente corpo de evidências, incluindo relatórios de casos prováveis que datam de novembro de 2019, de que os primeiros casos humanos de COVID-19 não foram associados ao Mercado de Frutos do Mar de Huanan, afirmam Bloom e outros cientistas.
“Para mim, parecia que o mercado de Wuhan foi um dos primeiros eventos de superespalhamento”, diz Sudhir Kumar, geneticista evolucionista da Temple University em Filadélfia, Pensilvânia. As sequências que Bloom desenterrou, acrescenta ele, sugerem que o SARS-CoV-2 desenvolveu grande diversidade nos primeiros estágios da pandemia na China - incluindo em Wuhan.
Stephen Goldstein, um virologista da Universidade de Utah em Salt Lake City, aponta que as sequências recuperadas por Bloom não estavam ocultas: elas são descritas em detalhes, com informações de sequência suficientes para saber sua relação evolutiva com outras sequências iniciais de SARS-CoV-2 , no jornal Pequeno . “Não acho que essa pré-impressão nos diga muitas novidades, mas traz dados de sequência de vanguarda que estão disponíveis publicamente, embora sob o radar”, diz Goldstein.
Bloom diz que embora as sequências tenham sido publicadas, sua remoção do SRA significava que poucos cientistas sabiam sobre elas. Um relatório encomendado pela Organização Mundial da Saúde sobre as origens da pandemia não incluiu as sequências em uma análise evolutiva dos primeiros dados do SARS-CoV-2. “Ninguém percebeu que eles existiam”, diz Bloom.
Os autores correspondentes do Small paper não responderam às perguntas da equipe de notícias da Nature sobre por que pediram que as sequências fossem removidas do SRA, o que aconteceu antes da publicação do artigo. Em nota, o NIH informou que retirou os dados a pedido dos pesquisadores, que afirmaram que planejam submetê-los a outro banco de dados.
Bloom - coautor de uma carta pedindo uma investigação renovada sobre as origens da pandemia, incluindo a possibilidade de o vírus ter escapado ou vazado de um laboratório 5 - diz que seu estudo não lança nenhuma luz sobre as origens da pandemia, nem por que as sequências foram removidas. Mas ele espera que seus esforços encorajem os pesquisadores a “pensar fora da caixa” e olhar para outras fontes, como dados de arquivo, para colher mais informações dos primeiros dias da pandemia. “Provavelmente há mais dados por aí”, diz ele.
Fonte:NATURE