![]() |
![]() |
Data Warehouse 24 heures |
écran rafraichi le |
Objectif commun aux cours DataWharehouse et
DataMining
Cube de données, OLAP/ROLAP, modèles de scores et d'attrition,
techniques statistiques, réseaux de neurones, text mining.
ex d'application: IBM Intelligent Miner, Oracle 8i
plan du cours IPA par eric.simon@inria.fr |
Ve 15/02 9h30-12h30 |
|
accéder à |
Ve 1/03 9h30-12h30 |
|
outils extraction, transformation ETL
100K+
outils cleaning et intégration 400K
|
Ve 8/03 9h30-12h30 |
DW télécom exposé gpe
1 v1
|
|
Ve 15/03 9h30-12h30 |
DW télécom exposé gpe
1 v2 contractuel DW télécom exposé gpe 2 v1 |
|
Ve 22/03 9h30-12h30 |
DW télécom exposé gpe
2 v2 contractuel DataMarts can be huge tables stored in another database (Oracle, Sybase, SQL Server, Access) or as data cubes (Essbase, PowerPlay, Business Objects...) but they can also take the form of text files (txt, csv, log) or of Excel files (xls)
|
applications OLAP :
|
Ve 29/03 9h30-12h30 |
DW télécom exposé gpe 3 v1 | |
Ve 5/04 9h30-12h30 |
DW télécom exposé gpe
3 v2 contractuel recette de la solution-gpe 3 par le gpe 1
|
|
Ve 12/04 9h30-12h30 |
débriefing projet DataWarehouse télécom |
Livres
www.mydecisionnel.com/BI27.htm
www.web-datamining.net/actualites/journal/2001/10/journal.asp
www.aubay.com/pdf/eBI.PDF
www.business-intelligence.co.uk/bieurope/english.asp
Séminaires en ligne www.spss.com/france/seminars/semiproduits.htm
Quelles différences y a
t-il entre Data Mining, Data Mart et Data
Warehouse ?
Alors que le data mining est un ensemble de techniques d'analyse statistique, les data
warehouses et les data marts sont des bases de données. Le data warehouse est la base de
données "d'entreprise" où sont stockées l'ensemble des informations
historisées sur les clients, produits. Le data mart est une base extraite du data
warehouse dédiée à un département particulier de l'entreprise : par exemple le data
mart marketing sera exploité par les outils DataMining pour fournir les connaissances
utiles au marketing.
Françoise FOGELMAN SOULIE, Directeur Associé www.businessdecision.com
Quels outils décisionnels pour Microsoft SQLServer 2000 ? par olivier.Matrat@winsight.fr
1) outils de développement cote Serveur
vous pouvez utiliser T-SQL pour programmer des bases
relationnelles (procedures stockees, triggers, batches) sous SQL2000.
Pour realiser et automatiser des taches d'administration vous pouvez utiliser certaines
taches dans Data Transformation Services, ainsi que les API SQL-DMO et SQL Namespace
depuis le langage de programmation de votre choix, par exemple VB ou VC++. En ce qui
concerne le developpement de frontaux clients vous pouvez utiliser ces memes langages
ainsi qu'ASP, conjugues avec ADO/ADO MD, l'API ouverte d'accès aux donnees
tabulaires/OLAP de Microsoft. Pour accélérer la programmation d'applications clientes,
notre societe a egalement developpe un certain nombre d'outils sous la forme de composants
COM packages que vous pouvez voir a l'oeuvre en ligne sur www.winsight.fr
2) outils de reporting
Excel 2000 permet d'acceder aux sources relationnelles et/ou OLAP
par l'intermediaire des tableaux/graphes croises dynamiques et de MS Query.
Pour le multi-dimensionnel vous pourrez etre interesse par l'offre www.knosysfrance.com , editeur du frontal ProClarity
dedie 100% a Microsoft SQL Server OLAP/Analysis Services et disposant de puissantes
capacites de navigation dynamique/reporting OLAP en client/serveur, client leger Web et
sous Excel.
3) outils a l'analyse multidimentionnel (statistique
et aide à la décision)
Pour les outils clients, cf. point 2) ci-dessus. Cote serveur, Microsoft
SQL Server 7 et 2000 integrent d'interessants outils d'analyse multi-dimensionnelle (MS
OLAP Services dans la version 7, MS Analysis Services en version 2000) et de data-mining
(version 2000 uniquement : algorithmes d'arbre de decision et de segmentation en
standard).
4) outils necessaire au data warehouse MS SQL Server 7 et 2000, contrairement aux versions precedentes, ont ete specialement concus pour permettre le Data Warehousing. Tous deux incluent en standard une grande partie des outils necessaires, notamment : un moteur relationnel (SQL Server) pour le stockage des data marts/data warehouses, un moteur ETL pour les chargements/transformations (Data Transformation Services), un moteur OLAP et DataMining (Analysis Services) pour l'analyse multi-dimensionnelle et la decouverte de donnees, un referentiel ouvert MS Repository pour le stockage et le partage des meta-donnees des differentes composantes du systeme. www.microsoft.com/business/bi/default.asp
- Pour les outils de reporting
www.brio.com Brio de BrioTechnology, BO
de Business objects, Imromptu de Cognos et MicroStrategy Intelligent Suite de Micro
Strategy, BI/suite de Hummingbird, Eureka suite de Computer Associates
- Pour les outils d'analyse multidimensionnelle
Les mêmes que ci-dessus + Powerplay de Cognos
- Pour les outils statistiques
SAS Enterprise Miner de SAS, Scenario et 4Thought de Cognos via Impromptu,
Alice d'Isoft, SPSS via ODBC
- Pour les outils nécessaires au data warehouse
(ETL)
Genio de Hummingbird, Powermart/powercenter d'Informatica, DataStage
d'Informix New Co, Extract d'ETI Sur chacun de ces sujets, CXP commercialise des études
comparatives packs experts
Laurence Dubrovin, Consultante Aide à Décision CXP ldubrovin@cxp-international.com www.cxp.fr