A camada semântica de dados é um conceito utilizado em várias disciplinas de ciência da computação e tecnologia da informação, especialmente em contextos de banco de dados, business intelligence (BI), e integração de dados. A função principal desta camada é fornecer um nível de abstração que […]
Um “data swamp” (pântano de dados) é como se descreve um ambiente de armazenamento de dados onde a informação está desorganizada, mal gerenciada, e difícil de acessar ou usar de maneira eficaz. Isso geralmente ocorre quando os dados são acumulados sem uma estrutura clara, padrões de […]
A primeira aproximação a um conjunto de dados desconhecido pode ser muito desafiadora. É necessário realizar testes e experimentos para tentar encontrar padrões que permitam escalar a análise, o que pode ser um processo lento, complexo e perigoso, já que um viés equivado nos dados em […]
Criar uma cultura de dados tem é essencial para as organizações modernas. Entre os muitos conceitos envolvidos nos processos de Governança de Dados (que podem ser bastante subjetivos dependendo da cultura da organização), um dos mais elusivos, é o de uma fonte única de verdade e […]
Data Storytelling é a técnica que usa dados na criação de histórias que engajam e conectam com o público de forma mais efetiva com o uso de visualizações que traduzem os dados de forma clara e envolvente. Além da ordem lógica do data storytelling, também contamos com […]
Um dicionário de dados é uma ferramenta ou recurso que contém metadados detalhados sobre os dados em um sistema de informação ou em uma organização. Ele fornece uma descrição abrangente de cada elemento de dados, incluindo definições, formatos, relacionamentos, restrições, origens e outros detalhes relevantes. Uma […]
Do ponto de vista de gerenciamento de dados e governança de dados, domínios de dados são às áreas ou contextos específicos nos quais os dados são coletados, armazenados, processados e utilizados. Cada domínio de dados pode representar um conjunto distinto de informações relacionadas a uma determinada […]
As dimensões que mudam lentamente (Slowly Changing Dimensions – SCDs) são usadas em data warehouses para lidar com alterações nos dados ao longo do tempo. Existem vários tipos de SCDs, cada um adequado para diferentes cenários. Cada tipo de SCD tem suas vantagens e desvantagens, e […]
Quem já se viu perdido em meio a uma montanha de dados desorganizados, sem saber se deveria usar uma View, CTE, ou até mesmo algo mais avançado para otimizar acessos do seu Dashboard do Power BI. Vejamos um guia de casos de uso para cada um […]
Python é uma das principais ferramentas no cinto de utilidades dos profissionais de dados. Graças a sua flexibilidade e poderosas bibliotecas, podemos usá-lo em todo o ecossistema atual de forma segura. Mas, quais elementos fundamentais dessa linguagem são importantes dominar? • Estruturas de dados integradas: list, […]