mercredi 30 septembre 2009

Réflexion sur les entrepots de données

Dans un entrepôt de données
  • Pas de données inutiles : les données en dehors du périmètre finissent toujours par polluer.
  • Une colonne de référence : elle est construite pour répondre au besoin de l’indicateur, afin de construire le minimum d’information au moment de la production de cet indicateur.
  • Pas de champ vide : ils compliquent les requêtes avec paramètres nuls.
  • Attention aux requêtes multi types de bases : la machine qui l’exécute doit bien avoir tous les accès.
  • Pour les dates des USA la date « d’action » peut être différente de la date comptable si l’action est faite après 18h (heure locale)
  • Les données de production et de test doivent être séparé.
 
technorati tags: