Definição estendida
Plano de gestão de dados (data management plan, DMP) é o documento formal que descreve como os dados de um projeto serão criados, organizados, documentados, armazenados, preservados e compartilhados ao longo de todo o ciclo de vida da pesquisa. Não é um anexo burocrático: é o instrumento que transforma a intenção abstrata de cuidar bem dos dados em decisões concretas e verificáveis, tomadas antes de a coleta começar. Michener (2015) sintetiza o que um bom DMP cobre: os tipos e formatos de dados, os padrões de metadados e documentação, as políticas de armazenamento e backup, a estratégia de preservação de longo prazo, as condições de acesso e licenciamento, e os papéis e responsabilidades da equipe. O DMP é o lugar onde os princípios FAIR, definidos por Wilkinson e colaboradores (2016), deixam de ser um ideal e viram um plano operacional, especificando como os dados serão encontráveis, acessíveis, interoperáveis e reutilizáveis. Miksa e colaboradores (2019) propõem ainda DMPs acionáveis por máquina, capazes de se conectar a sistemas e atualizar-se ao longo do projeto.
Quando se aplica
O DMP se aplica no início de um projeto, idealmente na fase de proposta, e é hoje exigência de muitas agências de financiamento como condição para o aporte. Aplica-se ao planejamento de infraestrutura: definir onde os dados vão morar, como serão versionados e por quanto tempo serão preservados evita decisões improvisadas no meio da pesquisa. Aplica-se à operacionalização dos princípios FAIR e da ciência aberta, fixando repositório, identificador persistente e licença antes de a primeira observação ser coletada. Aplica-se à governança de dados sensíveis, declarando como a privacidade e o consentimento serão respeitados. E aplica-se como documento vivo: um bom DMP é revisto à medida que o projeto evolui, não arquivado após a submissão da proposta.
Quando NÃO se aplica
O DMP não se aplica como formulário preenchido uma vez e esquecido: tratado como obrigação de submissão, perde a função de guiar a prática real de gestão de dados. Não se aplica como garantia de que os dados serão de fato compartilhados; um plano que promete depósito não substitui o depósito em si, e a declaração de disponibilidade de dados no artigo é que materializa o compromisso. Não se aplica de forma idêntica a todo projeto: o nível de detalhe e as restrições variam com o tipo de dado, a área e a sensibilidade, e copiar um modelo genérico sem adaptá-lo o esvazia. Não se aplica como substituto de infraestrutura: planejar a preservação sem um repositório real que a sustente é promessa sem lastro. E não se aplica isoladamente; sem orçamento, treino e responsáveis definidos, o DMP fica no papel.
Aplicações por área
- Pesquisa financiada: requisito de agências, em que o DMP integra a proposta e condiciona o aporte.
- Ciências da vida e ambientais: dados heterogêneos e de longo prazo, com forte demanda por padrões de metadados.
- Ciências sociais e saúde: dados sensíveis, em que o DMP declara consentimento, anonimização e acesso controlado.
- Pesquisa computacional: versionamento de dados e código, ligando o plano à reprodutibilidade.
Armadilhas comuns
A primeira armadilha é tratar o DMP como formulário de submissão, preenchido e esquecido em vez de revisado ao longo do projeto. A segunda é prometer compartilhamento sem garantir a infraestrutura que o sustente, deixando o plano sem lastro. A terceira é copiar um modelo genérico sem adaptá-lo ao tipo de dado e às restrições da área. A quarta é confundir o plano com a execução: um DMP não torna os dados FAIR por si só, apenas descreve como torná-los. A quinta é omitir orçamento, papéis e responsáveis, condições práticas sem as quais nenhuma das promessas do plano se concretiza.