retour HomePage business intelligence.gif (4920 bytes)

Data Warehouse  24 heures

écran rafraichi le
updated 12 mars 2002-feuillade@freesurf.fr

Objectif commun aux cours DataWharehouse et DataMining
Cube de données, OLAP/ROLAP, modèles de scores et d'attrition, techniques statistiques, réseaux de neurones, text mining.
ex d'application: IBM Intelligent Miner, Oracle 8i

plan du cours IPA   par  eric.simon@inria.fr

Ve 15/02
9h30-12h30
  • ppt 2-14   benchmark de transactions www.tpc.org/bench.descrip.html
  • TPC-C requêtes simples de gestion (transactions courtes, fréquentes )
  • TPC-D requête décisionnelle (transaction longue)

accéder à
l'espace projet DataWarehouse télécom

Ve 1/03
9h30-12h30
outils extraction, transformation ETL   100K€+

outils cleaning et intégration   400K€

Ve 8/03
9h30-12h30
DW télécom exposé gpe 1 v1
  • ppt 4-1 Modélisation des données d'un DataWarehouse
 
Ve 15/03
9h30-12h30
DW télécom exposé gpe 1 v2 contractuel
DW télécom exposé gpe 2 v1
 
Ve 22/03
9h30-12h30
DW télécom exposé gpe 2 v2 contractuel

DataMarts can be huge tables stored in another database (Oracle, Sybase, SQL Server, Access) or as data cubes (Essbase, PowerPlay, Business Objects...) but they can also take the form of text files (txt, csv, log) or of Excel files (xls)

applications OLAP :
Ve 29/03
9h30-12h30
DW télécom exposé gpe 3 v1  
Ve 5/04
9h30-12h30
DW télécom exposé gpe 3 v2 contractuel
recette de la solution-gpe 3 par le gpe 1
  • intervention d'éditeur de logiciel
 
Ve 12/04
9h30-12h30

débriefing projet DataWarehouse télécom

 

Livres

www.mydecisionnel.com/BI27.htm
www.web-datamining.net/actualites/journal/2001/10/journal.asp
www.aubay.com/pdf/eBI.PDF

www.business-intelligence.co.uk/bieurope/english.asp

Séminaires en ligne  www.spss.com/france/seminars/semiproduits.htm

Quelles différences y a t-il entre Data Mining, Data Mart et Data Warehouse ?
Alors que le data mining est un ensemble de techniques d'analyse statistique, les data warehouses et les data marts sont des bases de données. Le data warehouse est la base de données "d'entreprise" où sont stockées l'ensemble des informations historisées sur les clients, produits. Le data mart est une base extraite du data warehouse dédiée à un département particulier de l'entreprise : par exemple le data mart marketing sera exploité par les outils DataMining pour fournir les connaissances utiles au marketing.
Françoise FOGELMAN SOULIE, Directeur Associé
www.businessdecision.com


Quels outils décisionnels pour Microsoft SQLServer 2000 ?   par olivier.Matrat@winsight.fr

1) outils de développement cote Serveur
vous pouvez utiliser T-SQL pour programmer des bases relationnelles (procedures stockees, triggers, batches) sous SQL2000. Pour realiser et automatiser des taches d'administration vous pouvez utiliser certaines taches dans Data Transformation Services, ainsi que les API SQL-DMO et SQL Namespace depuis le langage de programmation de votre choix, par exemple VB ou VC++. En ce qui concerne le developpement de frontaux clients vous pouvez utiliser ces memes langages ainsi qu'ASP, conjugues avec ADO/ADO MD, l'API ouverte d'accès aux donnees tabulaires/OLAP de Microsoft. Pour accélérer la programmation d'applications clientes, notre societe a egalement developpe un certain nombre d'outils sous la forme de composants COM packages que vous pouvez voir a l'oeuvre en ligne sur www.winsight.fr

2) outils de reporting
Excel 2000 permet d'acceder aux sources relationnelles et/ou OLAP par l'intermediaire des tableaux/graphes croises dynamiques et de MS Query. Pour le multi-dimensionnel vous pourrez etre interesse par l'offre  www.knosysfrance.com , editeur du frontal ProClarity dedie 100% a Microsoft SQL Server OLAP/Analysis Services et disposant de puissantes capacites de navigation dynamique/reporting OLAP en client/serveur, client leger Web et sous Excel.

3) outils a l'analyse multidimentionnel (statistique et aide à la décision)
Pour les outils clients, cf. point 2) ci-dessus. Cote serveur, Microsoft SQL Server 7 et 2000 integrent d'interessants outils d'analyse multi-dimensionnelle (MS OLAP Services dans la version 7, MS Analysis Services en version 2000) et de data-mining (version 2000 uniquement : algorithmes d'arbre de decision et de segmentation en standard).

4) outils necessaire au data warehouse MS SQL Server 7 et 2000, contrairement aux versions precedentes, ont ete specialement concus pour permettre le Data Warehousing. Tous deux incluent en standard une grande partie des outils necessaires, notamment : un moteur relationnel (SQL Server) pour le stockage des data marts/data warehouses, un moteur ETL pour les chargements/transformations (Data Transformation Services), un moteur OLAP et DataMining (Analysis Services) pour l'analyse multi-dimensionnelle et la decouverte de donnees, un referentiel ouvert MS Repository pour le stockage et le partage des meta-donnees des differentes composantes du systeme.  www.microsoft.com/business/bi/default.asp


- Pour les outils de reporting
www.brio.com Brio de BrioTechnology, BO de Business objects, Imromptu de Cognos et MicroStrategy Intelligent Suite de Micro Strategy, BI/suite de Hummingbird, Eureka suite de Computer Associates

- Pour les outils d'analyse multidimensionnelle
Les mêmes que ci-dessus + Powerplay de Cognos

- Pour les outils statistiques
SAS Enterprise Miner de SAS, Scenario et 4Thought de Cognos via Impromptu, Alice d'Isoft, SPSS via ODBC

- Pour les outils nécessaires au data warehouse (ETL)
Genio de Hummingbird, Powermart/powercenter d'Informatica, DataStage d'Informix New Co, Extract d'ETI Sur chacun de ces sujets, CXP commercialise des études comparatives packs experts

Laurence Dubrovin, Consultante Aide à Décision CXP ldubrovin@cxp-international.com  www.cxp.fr