A Governança Moderna de Dados é descentralizada, federada e automatizada.Os Proprietários dos Produtos de Dados são responsáveis pelos dados que se originam em seus domínios. Para realizar essa abordagem descentralizada, precisamos de novos conceitos e ferramentas de suporte como: Atribuição de Responsabilidade Proprietário do Produto de […]
As funções de janela (Windows Functions), são extremamente poderosas no SQL, permitindo realizar cálculos complexos sem perder a granularidade dos dados. Elas operam sobre um conjunto de linhas (chamado “janela”) e podem fazer cálculos como totais acumulados, médias móveis e rankings, tudo sem precisar agrupar as […]
Os conceitos dos estilos de implementação de Master Data Management (MDM) evoluíram ao longo do tempo graças às contribuições de especialistas em MDM, líderes de pensamento e organizações especializadas em gerenciamento de dados. Esses estilos fazem parte das melhores práticas de gerenciamento de dados corporativos. Visão […]
Quando estamos fazendo uma análise inicial de dados em SQL, é essencial conhecer os recursos mais importantes para explorar, filtrar, agrupar e manipular os dados de forma eficiente. A seguir, apresento os 20 recursos mais importantes em SQL para essa tarefa, com exemplos explicados de cada […]
Pastelaria de dados é uma expressão usada de forma bem humorada (mas com certo desespero) para se referir à prática de trabalhar com os dados de forma informal, rápida (e rápida e suja, aplicando o framework Extreme Go Horse) e, pior, sempre urgente e improvisada. Esse […]
A camada semântica de dados é um conceito utilizado em várias disciplinas de ciência da computação e tecnologia da informação, especialmente em contextos de banco de dados, business intelligence (BI), e integração de dados. A função principal desta camada é fornecer um nível de abstração que […]
O uso de frameworks para as mais variadas atividades, no meu caso, de gestão de dados, oferece várias vantagens significativas para encurtar os tempos e melhorar as chances de alcançar os resultados esperados. Entre as vantagens a maior é se beneficiar da expertise, experiência e dos […]
Um “data swamp” (pântano de dados) é como se descreve um ambiente de armazenamento de dados onde a informação está desorganizada, mal gerenciada, e difícil de acessar ou usar de maneira eficaz. Isso geralmente ocorre quando os dados são acumulados sem uma estrutura clara, padrões de […]
A primeira aproximação a um conjunto de dados desconhecido pode ser muito desafiadora. É necessário realizar testes e experimentos para tentar encontrar padrões que permitam escalar a análise, o que pode ser um processo lento, complexo e perigoso, já que um viés equivado nos dados em […]
Time Travel Query é um recurso de bancos de dados que permite aos usuários consultar dados históricos, como se estivessem voltando no tempo para ver o estado do banco de dados em um momento anterior. Isso é feito através de versionamento de dados e ‘snapshots’ que […]