Estamos mergulhados numa etapa na qual os processos de transformação digital, a atualização dos nossos procedimentos de trabalho e processamento, bem como a proliferação de fontes de dados com as quais pode interoperar fazem com que a gestão dos dados resultantes desses processos se transforme num pilar fundamental.
Estas novas (e não tanto) e enormes quantidades de informação não só apresentam questões a resolver a nível de armazenamento ou suporte físico, mas também contam principalmente com um marco de trabalho que permita o aproveitamento e eficiente destes recursos em benefício do nosso trabalho, transformando estes dados em ativos que nos permitam melhorar a nossa eficiência ao serviço que oferecemos a partir das nossas organizações. Neste contexto, começamos a ter cada vez mais presente termos como o governo do dado (data governance, em inglês, também traduzido em ocasiões como “governança do dado”), mas o que é exatamente o governo do dado?
Muitas vezes custa definir algo positivo, mas todos temos em mente o que é o “desgoverno” do dado. É habitual contar com capacidades analíticas, a nível de ferramentas e equipamentos e que se criem relatórios e análises por cada uma das secções da nossa organização. Infelizmente, também é muito habitual que se acabe por “retratar” informação de forma redundante e que, no pior dos casos, se sigam definições e critérios de cálculo diferentes, criando realidades analíticas paralelas, tornando impossível contar com uma visão única do conhecimento e degradando o valor que os dados e a sua análise nos oferece para o nosso desempenho (para não falar da segurança e cumprimento normativo com respeito a esta questão).
O marco de trabalho necessário, com os processos, pessoas, recursos e ferramentas que permitam evitar estas situações, proporcionando uma visão holística da informação, é o que podemos denominar governo do dado.
Se procuramos uma definição concreta, podemos fazê-lo, simplificando da seguinte forma: “O governo do dado é a especificação de uma série de políticas à volta dos dados, que serão aplicadas através de processos, papéis e ferramentas dedicadas a esse efeito. O objetivo deste marco de trabalho é poder gerir de forma eficiente o ciclo de vida do dado, poder medir a sua qualidade, acedendo igualmente de forma segura e controlando, assegurando, além disso, a sua correta interpretação e utilização”.
Já nesta definição podemos identificar diferentes áreas ou âmbitos de atuação sobre as quais trabalharemos no marco do governo do dado. Baseando-nos em normas como Data Management Book of Knowledge (DMBOOK2), podemos identificá-las no seguinte esquema:
- Metadados (metadata, camada semântica), o termo “camada semântica” refere-se à camada que traduz a estrutura física dos dados na terminologia de negócio, que é familiar e conhecido pelos utilizadores de negócio. O seu desenvolvimento e supervisão facilitam a gestão do sistema por parte dos papéis associados.
- Qualidade do dado (Data Quality), implica o desenvolvimento e aplicação de métricas que permitam garantir a qualidade dos dados oferecidos pelo sistema.
- Arquitetura (Data Architecture), estrutura geral dos dados e dos recursos relacionados como parte integral da arquitetura da solução.
- Armazenamento e operações (Data Storage & Operations), armazenamento de dados estruturados, mecanismos de distribuição e administração de processos de carga.
- Modelagem de dados (Data Modeling & Design), contempla todas as tarefas relacionadas com a criação e construção, bem como a manutenção dos processos que alimentam o nosso repositório de dados (Data Warehouse).
- Segurança (Data Security), implementação de dados de todos os requisitos de segurança e privacidade associadas aos dados integrados no nosso sistema. De especial relevância de modo a cobrir os marcos normativos e esquemas de segurança vigentes.
- Integração e Interoperabilidade (Data Integration & Interoperability), processos de análises da adequação dos dados ao uso previsto. Inclui todas as tarefas necessárias para a sua consecução, como pode ser a limpeza, transformação e enriquecimento dos dados, bem como a integração de novas fontes necessárias segundo o âmbito de análise.
- Principais e Referência (Reference & Masterdata), criação de definições de dados principais (comuns) que permita a redução de redundâncias no sistema, fomentando uma reutilização adequada, redundando, por tanto, na garantia uma melhor qualidade dos dados.
- DWH & BI (Data Warehousing & Business Intelligence), atividades associadas ao acesso aos dados para a sua análise, bem como a criação de relatórios associados aos mesmos.
A aplicação e manutenção destes âmbitos e, consequentemente, o governo do dado dentro da nossa organização, vão implicar a atribuição de papéis específicos que garantam a execução de cada um dos processos associados para consecução. Para isso, devemos contar com ferramentas adequadas que facilitam o trabalho de governo, de forma a poder realizar-se de forma eficiente.
Quanto mais nos ajudarem e mais alinhadas com o governo do dado estejam estas ferramentas, redundará na redução do esforço necessário na sua manutenção.
Contar com os processos, bem como a atribuição de pessoas e as ferramentas necessárias, apoiando a nossa estratégia de governo do dado, permitirá conseguir uma visão holística do conhecimento, de forma a podermos garantir a integridade da informação utilizada, cobrindo em cada momento as exigências reais da nossa organização, tornando o dado num ativo que nos permita não só melhorar as nossas capacidades de análise, mas também a melhoria da eficiência do nosso dia a dia e acrescentar valor a todos os serviços que prestamos.