Modélisation Data Vault vs étoile : deux approches différentes, un même objectif

mai 29, 2026 Stephane Vivien Article BI Data Vault

La modélisation Data Vault et la modélisation en étoile sont souvent opposées, comme s’il fallait choisir l’une contre l’autre. En réalité, cette opposition est artificielle.

Ces deux approches ne répondent pas aux mêmes usages, n’ont pas les mêmes objectifs, et sont naturellement complémentaires dans une architecture Data moderne.

Comprendre leurs rôles respectifs est essentiel pour construire une plateforme data robuste, évolutive et performante.

Deux modèles, deux finalités

La première différence tient à l’intention.

La modélisation Data Vault est conçue pour :

  • intégrer des données hétérogènes,
  • absorber le changement,
  • historiser et tracer l’information,
  • servir de socle canonique d’entreprise.

👉 Elle est parfaitement adaptée à un Enterprise Data Warehouse (EDWH).

La modélisation en étoile, à l’inverse, est conçue pour :

  • faciliter l’analyse,
  • optimiser les performances de requête,
  • rendre les données lisibles pour les métiers,
  • supporter les outils BI.

👉 Elle est idéale pour les Data Marts orientés usages.

Opposer ces deux modèles revient à confondre fondations et interfaces.

Modèle Data Vault : le modèle de l’intégration et de la durabilité

La modélisation Data Vault repose sur une séparation stricte entre :

  • l’identification métier, avec les Hubs,
  • les relations, avec les Links,
  • les attributs historisés, avec les Satellites.

Ce modèle :

  • accepte la complexité du SI,
  • enregistre la réalité telle qu’elle est produite,
  • protège la plateforme contre les évolutions futures.

👉 Le Data Vault ne cherche pas à être simple à interroger, mais stable et facile à faire évoluer.

C’est pour cette raison qu’il constitue un excellent modèle pour l’EDWH : un socle transverse, partagé, audit-ready et durable.

Modélisation en étoile : le modèle de la restitution et de la performance

La modélisation en étoile, fondée sur les faits et les dimensions, poursuit un objectif radicalement différent :

  • simplifier la lecture,
  • optimiser les agrégations,
  • accélérer les requêtes analytiques.

Elle :

  • applique des règles métier explicites,
  • dénormalise les données,
  • sacrifie l’exhaustivité historique au profit de la performance.

👉 La modélisation en étoile est orientée utilisateurs et outils BI, pas intégration.

C’est pourquoi elle est parfaitement adaptée aux Data Marts, mais beaucoup moins à un EDWH complexe et évolutif.

Pourquoi elles ne s’opposent pas, mais se complètent

Dans une architecture Data Vault 2.0 mature :

  • le modèle Data Vault constitue le socle d’intégration, c’est-à-dire l’EDWH,
  • le Business Vault applique les règles métier,
  • les Data Marts en étoile exposent la donnée pour l’analyse.

Chaque couche joue son rôle :

  • le Data Vault garantit la fiabilité et la traçabilité,
  • l’étoile garantit la performance et la lisibilité.

👉 Chercher à faire de l’étoile un modèle d’intégration mène à la dette data.

👉 Chercher à faire du Data Vault un modèle de restitution mène à la frustration.

Exemple concret : paiement de prime

EDWH : Data Vault

On enregistre les paiements via des Links transactionnels et des Satellites historisés, sans calcul métier figé.

Data Mart : étoile

On expose une table de faits Paiements, avec des dimensions Client, Contrat, Temps, Canal, et des indicateurs agrégés.

👉 Même événement, deux représentations, car deux usages complémentaires.

Une architecture pensée pour durer

L’un des grands apports du Data Vault 2.0 est précisément d’avoir réconcilié :

  • la rigueur de l’intégration,
  • et l’efficacité de la restitution.

Il ne s’agit plus de choisir entre modélisation Data Vault ou étoile, mais de :

  • les positionner correctement,
  • les chaîner intelligemment,
  • les faire évoluer indépendamment.

Conclusion

La modélisation Data Vault et la modélisation en étoile ne sont ni concurrentes ni incompatibles.

Elles sont les deux piliers d’une architecture data moderne :

  • Data Vault pour l’EDWH : stabilité, traçabilité, évolutivité ;
  • Étoile pour les Data Marts : performance, lisibilité, efficacité BI.

👉 Une plateforme data robuste n’oppose pas les modèles.

👉 Elle les orchestre au service des usages.