Accueil

La Busness Inteligence

Rubriques

>> Toutes les rubriques <<
· Apropos de moi (0)
· Chaine de connexion (1)
· Deployer Pentaho en 2 min avec Tomcat (1)
· Funs Pentaho (0)
· JPivot (2)
· KETTLE (6)
· La Busness Inteligence (10)
· Mondrian (1)
· News (4)
· Offres (2)
· Pentaho (3)
· Pentaho Maroc (0)
· Telechargement (1)

Musique


Rechercher
Derniers commentaires

merci d'abord pour l'article, c'est quoi la différence entre un tableau de bord et un rapport?...
(Voir la suite)
Par abdo, le 09.06.2009


merci pour la remarque oui effectivement cette fois j'ai oublié de mentionner le nom merci encore ...
(Voir la suite)
Par Anonyme, le 01.04.2009


ca serais trés apprécié de citer votre sources. l'auteur du site www.systemeetl.com...
(Voir la suite)
Par Abdelghafour ELOMA, le 01.04.2009


merciiiiiiiiiiiiiiii...
(Voir la suite)
Par othmen , le 14.01.2009


http://www.jumbabox.c om/2008/09/how-to-ins tall-pentaho-on-ubunt u-hardy/ ...
(Voir la suite)
Par Loïc , le 13.01.2009


Articles les plus lus

· deployer Pentaho en 2 min avec Tomcat
· Organisation d'un datawarehouse(source file:///E:/
· OLAP(http://www.commentcamarche.net/entreprise/dat
· Les outils libres séduisent par leur coût (Source
· Stagiaire Nante pentaho

· ETL (Extract, Transform, Load)--(www.pentaho.org)
· Pentaho open source BI moves from Mozilla to GPL
· Conduite de projet Business Intelligence(Smile)
· Presentation (www.pentaho.org)
· Fonctionnalités (www.pentaho.org)
· Projet ETL
· Cycle de vie d'un ETL
· liens de telechargement
· Projet ETL
· difference entre Datawarhouce et Infocenter (Conservatoire National des Arts et Métiers de Lille Ver

Voir plus
 

Statistiques

Date de création : 29.11.2008
Dernière mise à jour : 09.04.2009
35 articles


Blogs et sites préférés

· blog
· blog
· Pentaho




Organisation d'un datawarehouse(source file:///E:/

Publié le 01/12/2008 à 12:00 par pentaho
2 Composants constituant un datawarehouse
Les composants de la majorité des entrepôts de données sont expliqués ci-dessous.



2.1 Données sources
Les data sources se rapporte à n'importe quel dépôt d'information qui contient des données d'intérêt à l'utilisation ou à l’analyse de gestion. Cette définition couvre les bases de données d'unité centrale (par exemple IBM DB2, ISAM, Adabas, Teradata, etc.), les bases de données de serveur de client (par exemple Teradata, IBM DB2, base de données d'oracle, Informix, serveur de Microsoft SQL, etc.), les bases de données de PC (par exemple Microsoft Access, Alpha, Five), les tableurs (par exemple Microsoft Excel) et n'importe quel autre stock électronique de données. Des données doivent être passées de ces systèmes à l'entrepôt de données sur une base de transaction-par-transaction pour les entrepôts en temps réel de données ou sur un cycle régulier (par exemple quotidiennement ou hebdomadaire) pour les entrepôts de données hors ligne.

2.2 Transformation de données
La couche de transformation de données reçoit des données des points d'émission de données, les nettoie, les normalise, et les charge dans le répertoire de données. Ceci s'appelle souvent les données d'"échafaudage" pendant que les données traversent souvent une base de données provisoire tandis qu'elles sont transformées. Cette activité des données de transformation peut être exécutée ou par code manuellement créé ou par un type spécifique de logiciel. Indépendamment de la nature du logiciel utilisé, les types suivants d'activités se produisent pendant la transformation de données :

- comparer des données de différents systèmes pour améliorer la qualité des données : par exemple la date de naissance pour un client peut être blanc dans un système mais contenir des données valides dans un deuxième système. Dans ce cas, l'entrepôt de données maintiendrait la date de naissance la zone du deuxième système.

- normalisant des données de différents systèmes par exemple si un système se rapporte au "mâle" et à la "femelle", mais une seconde se rapporte seulement à "M" et à "F", ces codes devraient être normalisés)

- exécutant d'autres fonctions de ménage de système telles que fichiers de détermination de changement (ou les "delta") pour réduire les moments de chargement de données, produisant ou trouvant des clés de remplacement pour les données etc...

2.3 Le datawarehouse
L'entrepôt de données est généralement une base de données relationnelle. Il doit être organisé pour tenir l'information dans une structure que les supports questionnent. La plupart des entrepôts de données tiennent l'information pendant au moins 1 année et parfois peuvent atteindre demi de siècle, selon la condition de conservation de données de définie par l’entreprise. En conséquence ces bases de données peuvent devenir très grandes.

2.4 Rapports de données
Les données dans le datawarehouse doivent être à la disposition du personnel de l'organisation, exemple la force de vente. Il y a un nombre très grand nombre d'applications qui exécutent cette fonction. Exemple de logiciel de reporting:

- Business Intelligence Tools : Applications qui simplifient le processus de rapport de données basé sur le datawarehouse. Exemple : Brio Designer, Hyperion Intelligence

- Outils OLAP : OLAP traite les données dans les structures multidimensionnelles et permet aux utilisateurs de choisir quelles dimensions ils désirent pour la visualisation

- Les outils d'extraction de données : sont des logiciels qui permettent aux utilisateurs d'exécuter des calculs mathématiques et statistiques détaillés sur des données détaillées de datawarehouse pour détecter des tendances,
identifier des configurations et analyser des données.






Ecrire un commentaire

Votre commentaire : Obligatoire
Votre nom :
Votre adresse email :
(Non publiée)
Votre centerblog : http://.centerblog.net
 





DERNIERS ARTICLES :
YachtWorld.com & Boats.com Unveil New Market Intelligence Product Based on Open Source Technologies
source : http://biz.yahoo.com/iw/080923/0436799.html ------------------------------------------------------------------------- Breadboard BI Assists YachtWorld.com & Bo
Reporting
Reporting Un article de Wikipédia, l'encyclopédie libre. Le reporting est la présentation périodique de rapports sur les activités et résultats d'une organisa
JPivot
JPivot est un client OLAP disposant d'une interface Web permettant de représenter un cube OLAP sous forme de tableau croisé multidimensionnel --Principales caract
Projet ETL
Phase Description de la phase Tâche Description de la tâche Responsable ------------------------------------------------------------------------------------------------
Projet ETL
Phase Description de la phase Tâche Description de la tâche Responsable ------------------------------------------------------------------------------------------------

forum