Definir a governança é sempre necessário em um protocolo de pesquisa, considerando que os dados são protegidos pela legislação, incluindo os direitos dos participantes de pesquisa. Este modelo determina que as instituições envolvidas compreendam os aspectos da pesquisa, os pontos de segurança da informação, e que completem o processo de envio de dados ao repositório central de forma clara, sem ambiguidades e garantindo ações éticas. De acordo com os aspectos da Lei Geral de Proteção de Dados (LGPD) (BRASIL, 2018), foram definidos três níveis de governança / acesso: 1) estratégico, 2) tático e 3) operacional. O Comitê Assessor do Projeto da Plataforma Covid-19 da OPAS representa o primeiro. O segundo é composto pelos responsáveis por traduzir a estratégia e integrar todas as partes, traçar os objetivos e gerenciar o projeto, incluindo a definição dos processos de trabalho, cronograma, engajamento e comunicação da equipe, qualidade e acompanhamento dos resultados. O terceiro realiza atividades a partir do nível tático sempre em conformidade com as normas e regras de segurança de dados.

A extração dos dados de prontuários eletrônicos
Considerando que as informações contidas nos registros hospitalares de cada instituição podem ser divididas entre estruturadas e texto aberto, e tendo em vista as heterogeneidades dos hospitais brasileiros em termos de preenchimento e gestão de dados, foi identificada a necessidade de organização da coleta de dados de modo a integrar as informações em texto aberto por meio de uma interface de programação automatizada (API). Essa API padronizada foi desenvolvida por profissionais de tecnologia da informação (TI) para coletar e compartilhar informações de bancos de dados de diferentes hospitais. Esses bancos de dados com disposição para armazenamento seguro baseado em nuvem contêm registros de saúde eletrônicos anonimizados no ambiente de rede da própria instituição, correspondentes às notas de cada participante de pesquisa.

A busca em texto aberto, para além dos campos estruturados, possibilitou maior completude de dados e assim, análises também mais completas, avançando no entendimento clínico da Covid-19 e análise de pesquisa entre diferentes serviços de saúde, objetivos centrais da iniciativa da OPAS/OMS junto à Rede. Para este procedimento, foi utilizado o software Smart Health Connect (SHC) que opera com base em algoritmo utilizando Redes Neurais Profundas (Deep Learning), extraindo informações das evoluções clínicas e incorporando dados aos formulários específicos da pesquisa. Neste momento da evolução da pesquisa foi proposta a união do grupo diante do conjunto de dados brasileiros “Big Data” das internações hospitalares da Covid-19 em um “data hub” sobre condições clínicas e padrões de uso do sistema de saúde: estávamos de fato com uma rede colaborativa de pesquisa.

Organização do Datahub
Para a organização do datahub e da estrutura de governança de dados do projeto, foram percorridas as seguintes etapas: a) os hospitais co-participantes possuem e disponibilizaram suas próprias bases de dados assistenciais com diferentes formatos e tecnologias; b) um modelo padrão de envio prevendo conjunto mínimo de dados foi definido e cada hospital mapeou suas bases em adequação ao modelo enviado pela gestão do projeto; c) foi criado um componente centralizador responsável pela curadoria dos dados a fim de gerar o datahub e a extração de relatórios de dados com as informações a serem analisadas; os dados enviados dos hospitais foram consolidados em um único local; d) os dados consolidados foram geridos pelo HCPA e armazenados em ambiente de serviços web de hospedagem na nuvem a partir da Amazon Web Services (AWS).

Foram realizadas várias etapas prevendo o desenvolvimento de métodos automatizados de extração de dados. O SHC realiza a categorização de dados presentes em texto aberto, como as evoluções clínicas contidas nos prontuários eletrônicos, por meio de inteligência artificial, identificando medicamentos, procedimentos, diagnósticos médicos, agravos (doenças e sintomas), dentre outros, possibilitando a extração dos dados e organização da variáveis de acordo com o disposto nos Case Report Forms (CRFs), disponíveis em publicação.
Para chegar ao atual nível de maturidade do SHC na identificação e extração dos dados especificamente das CRFs de Covid-19 e pós-COVID, foram realizadas etapas de validação do sistema de classificação do SHC por especialistas clínicos participantes do projeto, incluindo avaliação em pares de maneira independente de milhares de notas clínicas, garantindo a acurácia do sistema automatizado para a finalidade específica do projeto Plataforma Clínica Global Covid-19 OMS.

Fonte OPAS/OMS