Data Storytelling é a técnica que usa dados na criação de histórias que engajam e conectam com o público de forma mais efetiva com o uso de visualizações que traduzem os dados de forma clara e envolvente. Além da ordem lógica do data storytelling, também contamos com […]
Um dicionário de dados é uma ferramenta ou recurso que contém metadados detalhados sobre os dados em um sistema de informação ou em uma organização. Ele fornece uma descrição abrangente de cada elemento de dados, incluindo definições, formatos, relacionamentos, restrições, origens e outros detalhes relevantes. Uma […]
Do ponto de vista de gerenciamento de dados e governança de dados, domínios de dados são às áreas ou contextos específicos nos quais os dados são coletados, armazenados, processados e utilizados. Cada domínio de dados pode representar um conjunto distinto de informações relacionadas a uma determinada […]
Um silo organizacional é uma estrutura dentro de uma organização que que cria uma dinâmica na qual as diferentes áreas ou departamentos funcionam de forma isolada, compartimentada, com pouca comunicação e colaboração entre eles. Basicamente, fazendo que a organização se fragmente em múltiplas organizações menores, com […]
As dimensões que mudam lentamente (Slowly Changing Dimensions – SCDs) são usadas em data warehouses para lidar com alterações nos dados ao longo do tempo. Existem vários tipos de SCDs, cada um adequado para diferentes cenários. Cada tipo de SCD tem suas vantagens e desvantagens, e […]
Quem já se viu perdido em meio a uma montanha de dados desorganizados, sem saber se deveria usar uma View, CTE, ou até mesmo algo mais avançado para otimizar acessos do seu Dashboard do Power BI. Vejamos um guia de casos de uso para cada um […]
Medallion Architecture ou “Arquitetura em Medalhões” é a ideia de uma estrutura hierárquica em camadas, onde cada camada representa um nível de qualidade e governança dos dados.A representação em camadas bronze, prata e ouro estabelece uma estrutura hierárquica para gerenciar e organizar os dados de acordo […]
Dados mestres e dados de referência são conceitos relacionados, mas têm algumas diferenças importantes: Dados Mestres Dados mestres são os principais registros de dados que são essenciais para as operações de uma organização. Eles representam os objetos fundamentais com os quais uma empresa opera e geralmente […]
Trabalhar com qualidade de dados se envolve monitorar as fontes de dados e detectar problemas anomalias. Há fontes de dados entrando. Podem ser dados estruturados ou seus data lakes. Onde quer que se armazenem os dados importantes, é necessário analisá-los. A plataforma deve analisar suas fontes […]
Quem trabalha com a poderosa biblioteca Python Pandas se depara com centenas de funções adequadas para infinitos cenários mas, no dia a dia, acabamos usando apenas um punhado que realizam a maioria das tarefas que precisamos: Funções de 𝗟𝗲𝗶𝘁𝘂𝗿𝗮 𝗱𝗲 𝗗𝗮𝗱𝗼𝘀: 1. pd.read_csv(): permite acessar dados […]