Após um período-piloto de testes e de consultas à comunidade de pesquisa, entrou em operação nesta quarta-feira (1º) o COVID-19 Data Sharing/BR, o primeiro repositório de dados abertos do Brasil com dados demográficos e exames clínicos e laboratoriais de pacientes que fizeram testes para a doença em unidades laboratoriais no país e em hospitais do estado de São Paulo.
O repositório abriga dados abertos e anonimizados de, inicialmente, mais de 177 mil pacientes, 9.634 dados de desfecho e um total de quase 5 milhões de resultados de exames clínicos e laboratoriais realizados em todo o país pelo Grupo Fleury e na cidade de São Paulo pelos hospitais Israelita Albert Einstein e Sírio-Libanês desde novembro de 2019.
Ainda que o primeiro caso da doença no Brasil tenha sido registrado em fevereiro, pelo Hospital Albert Einstein, o período de cobertura dos dados permitirá aos pesquisadores analisarem o histórico de saúde, bem como buscar evidências de sintomas de COVID-19 em pacientes atendidos anteriormente.
Novos dados serão inseridos regularmente pelo Grupo Fleury, Hospital Sírio-Libanês e Israelita Albert Einstein e gerenciados no repositório, sediado na Universidade de São Paulo (USP). As quatro instituições disponibilizaram informações, infraestrutura, tecnologias e recursos humanos próprios para viabilizar o compartilhamento de dados.
A Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp) está em tratativas avançadas com outras instituições de atendimento a pacientes, públicas e privadas, para compartilhar informações no repositório COVID-19 Data Sharing/BR.
A base de dados é resultado de uma iniciativa da Fapesp, em parceria com a Universidade de São Paulo (USP), e tem o objetivo de compartilhar informações clínicas anonimizadas de pacientes para subsidiar pesquisas científicas sobre a doença nas diversas áreas de conhecimento.
“Ciência é cada vez mais uma atividade coletiva e as iniciativas de compartilhamento de dados têm se ampliado em todo o mundo. A estratégia de Open Science da Fapesp é o pano de fundo desta iniciativa. Buscamos aproveitar a crise para alavancar a iniciativa de Data Sharing sediada na USP. Nossa expectativa é que possamos não apenas agregar novos parceiros, mas, sobretudo, contribuir para que a comunidade cientifica tenha dados de qualidade para propor soluções que nos permitam enfrentar a pandemia”, afirma à Agência Fapesp Luiz Eugênio Mello, diretor-científico da Fundação.
Categorias
O repositório disponibiliza três categorias de informação: dados demográficos (gênero, ano de nascimento e região de residência do paciente) e de exames clínicos e/ou laboratoriais, além de informações, quando disponíveis, sobre a movimentação do paciente, como internações, por exemplo, e desfecho dos casos, como recuperação ou óbitos.
Em uma segunda etapa, que já está sendo planejada pela iniciativa, o COVID-19 Data Sharing/BR abrigará também dados de imagens, como radiografias e tomografias.
O lançamento do repositório teve um cronograma de três etapas. Uma versão pequena do conjunto de dados foi inicialmente disponibilizada no dia 17 de junho para um período-piloto de consultas. Dessa forma, a comunidade de pesquisa pôde baixar os dados e começou a analisá-los e visualizá-los usando técnicas de ciência de dados.
Até o dia 24 de junho, os grupos de pesquisa interessados puderam enviar dúvidas e comentários para os responsáveis pelo repositório COVID-19 Data Sharing/BR. Nesse período, foram recebidos cerca de 30 e-mails com perguntas e sugestões de pesquisadores.
Contribuições
As contribuições da comunidade de pesquisa irão ajudar a melhorar as informações e a documentação do repositório. “Todas as sugestões serão analisadas e verificaremos o que poderá ou não ser implementado em curto, médio e longo prazo”, diz à Agência Fapesp Cláudia Bauzer Medeiros, professora do Instituto de Computação da Universidade Estadual de Campinas (Unicamp) e participante do projeto.
Uma das sugestões já resultou em um pequeno ajuste na versão final do repositório. “Na maior parte das situações vamos analisar o que pode ser feito para contribuir para o maior número possível de pesquisas”, afirma Medeiros, que integra a coordenação do Programa Fapesp de Pesquisa em eScience e Data Science.
Além de pesquisadores do Brasil, o conjunto inicial de dados disponibilizado no dia 17 de junho para consultas foi acessado e baixado por cientistas dos Estados Unidos, Portugal, Espanha, Alemanha, Bélgica, Argentina, Romênia, Holanda, Reino Unido, Índia, Canadá, França, Finlândia e Tailândia.
Iniciativas internacionais
O lançamento do repositório faz parte de um movimento da ciência global, denominado ciência aberta, com o objetivo de tornar públicos os dados utilizados em pesquisas e que ganhou maior força com a pandemia de COVID-19.
Além do repositório lançado pela Fapesp, outras agências de fomento à pesquisa no mundo estão adotando iniciativas semelhantes.
No dia 16 de junho, o Centro Nacional de Dados para a Saúde (CD2H) e o Centro Nacional de Ciência Translacional Avançada (NCATS), dos Estados Unidos, anunciaram a criação de um portal centralizado de dados clínicos de pacientes com COVID-19. A iniciativa é resultado de uma parceria com diversas agências norte-americanas, incluindo o National Institutes of Health (NIH).
De acordo com um comunicado à imprensa, a plataforma, chamada N3C (sigla em inglês de National COVID Cohort Collaborative), irá capturar sistematicamente dados clínicos, de diagnóstico e de laboratório de centros de pesquisa e prestadores de serviços de saúde participantes em todo o país e agregá-los em um formato mais padronizado e de fácil acesso, de modo a permitir que os usuários tenham novas ideias de pesquisa colaborativa.
Os dados brutos, contudo, não serão disponibilizados. “Eles utilizarão um padrão internacional que não permitirá ter acesso aos dados brutos, mas a uma interface para um sistema que permitirá solicitar análises de um conjunto de dados e a plataforma fornecerá os resultados”, explica Medeiros.
Rede
Outra iniciativa recente de disponibilização de dados clínicos de COVID-19 foi a Rede de Implementação do VODAN, na Europa.
Resultado de uma parceria público-privada, o objetivo do consórcio VODAN é tornar os dados sobre a doença públicos, de modo que sejam localizáveis, acessíveis, interoperáveis – FAIR, na sigla em inglês de Findable, Acessible, Interoperable and Reusable – e, portanto, reutilizáveis por humanos e computadores.
“Atualmente, há uma série de iniciativas listadas nessa plataforma, em todos os níveis de compartilhamento de dados, com protocolos de disponibilização bastante rígidos”, diz Medeiros.
Alguns dos diferenciais do COVID-19 Data Sharing/BR em relação a esses projetos internacionais são que a plataforma reúne dados de brasileiros e com qualidade suficiente para incluí-los em grandes estudos internacionais. Dessa forma, a iniciativa contribui não apenas para pesquisas voltadas à realidade brasileira, mas também para acelerar a pesquisa mundial na busca por uma vacina ou cura da doença, avalia a pesquisadora.
“Muitos dos dados que estão sendo colocados em plataformas internacionais são de ensaios clínicos, e não de exames clínicos e laboratoriais de pacientes como são os do COVID-19 Data Sharing”, compara.