“Data Mesh” é um modelo de gerenciamento de dados distribuídos com uma filosofia de descentralização, empoderamento e self-service.
Proposto por Zhamak Dehghani, engenheira da empresa ThoughtWorks, e ganhou popularidade como uma abordagem para resolver os desafios do gerenciamento de dados em escala em empresas modernas e orientadas por dados.
O data mesh busca descentralizar o controle de dados e distribuir a responsabilidade de gerenciamento de dados para os times de negócios, em vez de depender de uma equipe centralizada de engenheiros de dados ou cientistas de dados. Essa descentralização é alcançada através da criação de “domínios de dados” autônomos, cada um sendo de propriedade e gerenciado por um time específico, geralmente aquele que é o especialista no domínio em questão.
Princípios fundamentais:
- Domínios de dados:
- Os dados são divididos em domínios baseados em áreas de negócio, produtos ou fluxos de trabalho específicos.
- Cada domínio é responsável por definir seus próprios padrões de qualidade, governança e acesso aos dados.
- Self-serve Data Infrastructure (Infraestrutura de dados self-service):
- Cada domínio de dados possui sua própria infraestrutura de dados, permitindo que eles usem as ferramentas e tecnologias mais adequadas para suas necessidades.
- Product Thinking (Pensamento ou abordagem de produto):
- Os domínios de dados são tratados como produtos, com equipes responsáveis pelo desenvolvimento, suporte e evolução contínua dos dados e pipelines relacionados.
- Data as a Product (Dados como produto):
- Os dados de alta qualidade são tratados como produtos valiosos que agregam valor aos usuários finais.
- Federated Governance (Governança federada):
- Existe uma governança global para garantir a conformidade, padrões comuns e políticas de segurança em toda a organização, mas a governança operacional é descentralizada para os domínios de dados.
A ideia por trás do data mesh é que, ao distribuir o gerenciamento de dados para os times de negócio, há uma maior capacidade de resposta às necessidades específicas, menor centralização de gargalos e um ambiente de dados mais flexível e adaptável. No entanto, é importante notar que o data mesh ainda é uma abordagem em desenvolvimento, e sua aplicação prática pode variar de acordo com o contexto organizacional e tecnológico.
Comments are closed