Intégration d'un système décisionnel d'aide à la prise de décisions aux campagnes marketing et commerciales dans les entreprises de vente en ligne

Data Warehouse et Business Intelligence


Thèse de Master, 2020

129 Pages, Note: Master II


Extrait

SOMMAIRE

SOMMAIRE

DEDICACE

REMERCIEMENTS

LISTE DES TABLEAUX

LISTE DES FIGURES

ABREVIATIONS

GLOSSAIRE

EPIGRAPHE

RESUME

ABSTRACT

INTRODUCTION GENERALE

PREMIERE PARTIE : CONTEXE DU TRAVAIL

Chapitre I : Etat de l’art des systèmes décisionnels
I.1 Systèmes décisionnels classiques (traditionnels)
I.2 Systèmes d’aide à la prise de décision moderne
I.3 Généralités sur les campagnes marketing et les campagnes commerciales

Chapitre II : Etat des lieux du système actuel de gestion des campagnes markéting et commerciales
II.1 Brève présentation de l’entreprise
II.2 Etude du système actuel de gestion

DEUXIEME PARTIE : PROJET DE CREATION DU SYSTEME D’AIDE A LA DECISION.

Chapitre III : Cahier de charges
III.1 Contexte
III.2 Objectifs et intérêt du travail
III.3 Charte du projet
III.4 Exigences fonctionnelles
III.5 Exigences non fonctionnelles
III.6 Gestion du projet

Chapitre IV : Analyse et conception du système d’aide à la prise de décision
IV.1 Analyse
IV.2 Conception

Chapitre V : Implémentation et déploiement du système
V.1 Implémentation
V.2 Déploiement
V.3 Reporting: résultats

CONCLUSION GENERALE ET PERSPECTIVES

REFERENCES BIBLIOGRAPHIQUES

TABLE DE MATIERES

LISTE DES ANNEXES

ANNEXES

DEDICACE

Abbildung in dieser Leseprobe nicht enthalten

REMERCIEMENTS

Nous ne saurions commencer la rédaction de ce mémoire sans remercier un ensemble de personnes qui de près ou de loin ont contribué à l’aboutissement de ce travail. Cependant, il y a des personnes à qui je tiens à exprimer ma plus profonde reconnaissance, gratitude et de respect à leurs égards.

A l’occurrence:

- M. GUIMEZAP Paul, président fondateur de l’IUC, pour l’opportunité et la qualité de la formation mises à notre disposition,
- Mon superviseur académique, Dr MBOU TIAYA Elvis pour sa supervision et le sens du détail qui a permis de faire au mieux ce travail,
- Mon encadreur académique, M NYAM Aquila & Mon encadreur professionnel M TCHANGA Fernand pour leur suivi, leur disponibilité, leurs conseils et recommandations tout au long de la rédaction de notre mémoire ;
- M. TSOPBENG David, le Directeur de l’ISTDI, pour ses multiples conseils, son désir de toujours venir en aide aux étudiants et pour son encadrement durant toute cette année académique ;
- Tous les membres de Multi Canal Services pour l’accueil et la coopération dont ils ont fait preuve ;
- Tous les Enseignants de l’Institut Universitaire de la Côte (IUC) pour les cours dispensés ;
- Dr FOUOKENG Georges, lui qui a toujours été proche des étudiants afin de trouver des solutions à leurs différents problèmes ;
- Ma grande mère chérie MIAMAH né NGOUFO Louise pour son amour et la sagesse quelle nous inculque au jour le jour,
- Ma maman MEZAMO Valery Nicole pour tout l’amour et l’assistance de toute nature quelle ma portée,
- A la famille Pô-MIAMAH pour l’amour, le sens du devoir et l’accompagnement de toute nature quelle m’a toujours apporté,
- A la famille TSAFACK Pierre Marie pour le sens de la famille qu’elle m’a fait revivre,
- Ma maman MADJOUO ZEFACK Berline pour son amour et son soutient de toute nature,
- Toute ma famille pour leur soutien incontestable ;
- Tous les étudiants des promotions SIGL IUC de 2019 à 2020.

Finalement, j’exprime mes vifs et sincères remerciements à toute personne ayant participé de près ou de loin au bon déroulement et à la réalisation de ce modeste travail.

LISTE DES TABLEAUX

Tableau 1: Etude des niveaux de décision

Tableau 2: Tableau comparatif entre les systèmes transactionnels et les systèmes décisionnels

Tableau 3: Synthèse entre les différentes méthodes d'intégration

Tableau 4: Synthèse des différentes techniques de synchronisation

Tableau 5: Synthèse comparative entre OLAP et OLTP

Tableau 6: Fiche signalétique de MCS

Tableau 7: Les versions de la charte projet

Tableau 8: Les autorisations

Tableau 9: Liste des MOA

Tableau 10: Les risques de ralentissement

Tableau 11: Avantages et inconvénients de l’approche « Besoins d’analyse »

Tableau 12: Avantages et inconvénients de l’approche « Sources de données»

Tableau 13: Illustration de l’approche mixte

Tableau 14: Tableau présentant la population à interviewer

Tableau 15: Synthétisation des besoins recensés

Tableau 16: Tableau descriptif de la dimension « Temps »

Tableau 17: Tableau descriptif de la dimension « Client »

Tableau 18: Tableau descriptif de la dimension « Facture »

Tableau 19: Tableau descriptif de la dimension « Zone géographique »

Tableau 20: Tableau descriptif de la dimension «Activité»

Tableau 21: Tableau descriptif de la dimension « Tarif »

Tableau 22: Tableau descriptif de la dimension « Produits »

Tableau 23: Liste des agrégats potentiels pour l’activité « Vente »

Tableau 24: Liste des agrégats utiles de l’activité « Vente »

Tableau 25: Détection des dimensions communes entre les volets « Vente »et « action marketing »

Tableau 26: Tableau descriptif de la dimension «General_Insights_Pages»

Tableau 27:Tableau descriptif de la dimension «Insights_by_Age_and_Gender_Pages»

Tableau 28: Tableau descriptif de la dimension «Insights_by_City_Pages»

Tableau 29:Tableau descriptif de la dimension «Insights_by_ Language_Pages»

Tableau 30: Tableau descriptif de la dimension «Page_Information_Pages»

Tableau 31: Tableau descriptif de la dimension «Insights_by_Country_Pages»

Tableau 32: Liste des agrégats utiles et potentiels de l’activité « marketing »

Tableau 33: Détection des dimensions communes entre les volets « Vente », « Concurrence » et « action commerciale »

Tableau 34:Tableau descriptif de la dimension «Page_Concurrence»

Tableau 35: Tableau descriptif de la dimension «Posts_Concurrence»

Tableau 36: Liste des agrégats utiles et potentiels de l’activité « Concurrence »

Tableau 37: Dimensions communes entre les volets « Vente » et « action commerciale »

Tableau 38: Tableau descriptif de la dimension « Prospect »

Tableau 39: les agrégats potentiels de l'activité campagne commerciale

Tableau 40: Les agrégats utiles de l'activité campagne commerciale

LISTE DES FIGURES

Figure 1: Pyramide des niveaux d'activités dans l'entreprise

Figure 2: Pyramide de la typologie de prise de décision [Bernard, 2014]

Figure 3: Evolution de la Business Intelligence en 4 étapes

Figure 4: Schéma décrivant le processus de générale d'extraction des données jusqu'au BI

Figure 5: Architecture global d’un Data Warehouse

Figure 6: Schéma fonctionnel du data intégration

Figure 7: Architecture fonctionnelle d'un ETL.

Figure 8: Architecture fonctionnelle des EAI

Figure 9: Principe de l’architecture MOLAP [Nakache, 1998]

Figure 10: Principe de l’architecture ROLAP [Nakache, 1998]

Figure 11: Illustration de l’approche « Besoins d’analyse » grâce au cycle de vie dimensionnel de Kimball [Kimball, 2004]

Figure 12: Illustration de l’approche « Source de données » grâce au cycle de développement du DW d’Inmon [Inmon, 2002]

Figure 13: Schéma descriptif de la méthode V et agile

Figure 14: Schéma comparatif des méthodes classiques par rapport à la méthode agile

Figure 15: Schéma explicatif de la méthode agile

Figure 16: Place de l’étape d’étude des besoins dans un projet DW..

Figure 17: Classification des activités par priorité

Figure 18: Business model de synchronisation Odoo et Livraison Express

Figure 19: Modèle en étoile de l’activité « Vente »

Figure 20: Le modèle en étoile de l’activité « Campagne marketing »

Figure 21: Le modèle en étoile de l’activité « Campagne marketing »

Figure 22: Le modèle en étoile de l’activité « Campagne commerciale »

Figure 23: L’architecture du processus d’alimentation

Figure 24: Diagramme d’activité du processus d’alimentation

Figure 25: Diagramme d’activité du processus de chargement de dimension

Figure 26: Diagramme d’activité du processus de chargement de faits

Figure 27: DCU navigation dans les métas donnés

Figure 28: DCU supervision

Figure 29: Architecture technique de la solution

Figure 30: Classement des outils ETL selon Forrester Research

Figure 31: Digramme de déploiement de la zone d’alimentation

Figure 32: Diagramme de déploiement de la zone de restitution

ABREVIATIONS

Abbildung in dieser Leseprobe nicht enthalten

GLOSSAIRE

Processus cognitif : Les processus cognitifs sont les différents modes à travers lesquels un système traite l'information en y répondant par une action.

L'entreprise service bus (ESB): elle est une technique informatique intergicielle. Son but est avant tout de permettre la communication des applications qui n'ont pas été conçues pour fonctionner ensemble (par exemple deux progiciels de gestion intégrés provenant d'éditeurs différents).

L’effet tunnel: il décrit la situation d’un projet qui affiche un retard par rapport au plan initial avec très peu de visibilité.

Veille concurrentielle : elle est l’activité continue et en grande partie itérative qui vise à une surveillance active de l’environnement, qu’il soit technologique ou commercial, des acteurs ou nouveaux entrants, pour en anticiper les évolutions de façon stratégique.

Cloud : il est la livraison des ressources et services via internet.

Logiciel Open source : il est programme informatique dont le code source est distribué sous une licence permettant quiconque de lire, modifier ou redistribuer ce logiciel.

Logiciel Libre : il est un logiciel dont l’utilisation, l’étude, la modification et la duplication par autrui en vue d’une diffusion est permises techniquement et légalement.

Banque de donnée : elle est l’ensemble de données relatif à une connaissance stockée dans une base.

EPIGRAPHE

« Connaître les autres, c’est sagesse. Se connaitre soi-même, c’est sagesse supérieure. Imposer sa volonté aux autres, c’est force. Se l’imposer à soi-même, c’est force supérieure. » Lao-Tseu

RESUME

La thématique principale de ce travail se fait dans le cadre du mémoire de fin d’étude afin d’obtenir notre diplôme de master professionnel en système d’information option génie logiciel concerne Intégration d’un système décisionnel d’aide à la prise de décisions aux campagnes marketing et campagnes commerciales dans les entreprises de vente en ligne. Cas de Multi Canal Services(MCS) qui une entreprise de la place. Afin de bien comprendre les concepts, le fonctionnement de MCS, nous avons effectués un état des lieux qui nous a permis de comprendre le système décisionnel de MCS et de déceler ces limites. Pour pallier à ces limites, nous avons proposés un système d’aide à la prise décision donc les résultats finaux sont les reporting comme objectifs fixé dans le cahier des charges en passant par une analyse du système existant, une conception (de la zone d’entreposage, de la zone d’alimentation, des meta données), par une implémentation et un déploiement de l’entrepôt des données. Pour éviter l’effet tunnel, nous nous sommes appuyés sur l’une des méthodes de gestion des projets les plus utilisé du moment qui est la méthode agile tout en découpant les sprints selon le principe SMART. Tout ceci va se faire en suivant les règles éditées par les deux pères fondateurs de l’entrepôt de données : William H. Inmon l’inventeur du concept et Ralph Kimball. Une fois l’entrepôt de données construites, nous avons fait usage des outils de reporting comme PowerBI et Zoho Analytic pour diverse raison.

Mots clés : Entrepôt de Donnée, Système décisionnel, Campagne marketing et commerciale, reporting, Analyse en ligne des données.

ABSTRACT

The main theme of this work is done as part of the end of study thesis in order to obtain our professional master's degree in information system option software engineering concerns Integration of a decision-making system to help decision-making marketing campaigns and sales campaigns in online sales companies. Case of Multi Canal Services (MCS) which is a local business. In order to fully understand the concepts, the functioning of MCS, we carried out an inventory which allowed us to understand the decision-making system of MCS and to detect these limits. To overcome these limitations, we have proposed a decision-making support system so the final results are the reporting as objectives set in the specifications through an analysis of the existing system, a design (of the area of storage, feed area, metadata), through an implementation and deployment of the data warehouse. To avoid the tunnel effect, we relied on one of the most widely used project management methods of the moment, which is the agile method while dividing the sprints according to the SMART principle. All this is done by following the rules published by the two founding fathers of the data warehouse: William H. Inmon the inventor of the concept and Ralph Kimball. Once the data warehouse was built, we made use of reporting tools like PowerBI and Zoho Analytic for various reasons.

Keywords: Data warehouse, Decision-making system, Marketing and sales campaign, reporting, Online data analysis.

INTRODUCTION GENERALE

Les technologies de l’information et de la communication font évoluer le monde entier, en particulier celui des entreprises qui est généralement soumis à une forte concurrence. Ceci exige une réactivité afin de ne pas se laisser distancer par les concurrents.

Pour se faire, les dirigeants de l’entreprise, quelque en soit d’ailleurs le domaine d’activité, doivent être en mesure de mener à bien les missions qui leur incombent. Ils devront prendre notamment les décisions les plus opportunes. Ces dernières, qui influenceront grandement sur la stratégie de l’entreprise et donc sur son devenir, ne doivent pas être prises ni à la légère, ni de manière trop hâtive, compte tenu de leurs conséquences sur la survie de l’entreprise. Il s’agit de prendre des décisions fondées, basées sur des informations, fiables et pertinentes. Le problème est de savoir donc comment identifier et présenter ces dernières à qui de droit, sachant par ailleurs que les entreprises croulent d’une part sous une masse considérable de données et que d’autre part les systèmes opérationnels « transactionnels » qui s’avèrent limités, voire inaptes à fournir de telles informations et constituent par la même un support appréciable à la prise de décision.

Sur ce, Multi Canal Services est une entreprise de services informatiques spécialisée dans l’intégration de solutions logiciels et le commerce électronique; où nous avons pu dénombrer un ensemble de problèmes dans la gestion du système d’information. Cas les logiciels utilisés sont basés sur des technologies différentes mais partagent des données communes, il y’a donc un problème de redondance des traitements et d’intégrité des données. On observe aussi une grande source de données venant de son environnement interne et externe. Ce pendent, ces données ne sont pas exploitées de manière satisfaisante, hypothéquant ainsi le processus de prise de décision à tous les niveaux. Pour y remédier, nous proposons de prime abord sur une solution de synchronisation des données entre les sources de données pour garantir l’intégrité et la fiabilité des données. Puis une mise sur pied d’un Data Warehouse afin de garantir une source donnée pour des fins de prise de décision.

Le présent document est structuré en deux parties et cinq chapitres : Le premier chapitre qui traite de l’état de l’art; le deuxième chapitre intitulé Etat des lieux; le troisième chapitre intitulé Cahier de charges; le quatrième chapitre intitulé Analyse, conception et le cinquième chapitre intitulé Implémentation et déploiement.

PREMIERE PARTIE : CONTEXE DU TRAVAIL

« Un entrepôt de données ne s'achète pas, il se construit. » Bill Inmon

Chapitre I : Etat de l’art des systèmes décisionnels

Ce chapitre a pour but de vous présenter les grands concepts qui seront abordés tout le long de notre mémoire. Nous pouvons citer : les systèmes décisionnels (classiques et assistés par l’informatique), les campagnes marketing, les campagnes commerciales, les Data Warehouse, Business Intelligence, intégration des données, synchronisation des données et analyse en ligne des données.

I.1 Systèmes décisionnels classiques (traditionnels)

Chacun d’entre nous prend quotidiennement de nombreuses décisions. La prise de décision correspond au fait d’effectuer un choix entre plusieurs modalités d’actions possibles lors de la confrontation à un problème, le but étant de le résoudre en traduisant le choix fait en un comportement (en une séquence d’action). Elle implique un certain nombre d’opérations distinctes : la définition de l’objet (ce sur quoi porte la réflexion et portera la décision), la recherche, l’analyse et l’organisation des informations utiles, l’élaboration et l’évaluation d’hypothèses de décisions en prenant en particulier appui sur des connaissances et/ou des expériences antérieures, le choix d’une hypothèse de décision et sa mise en œuvre. Certaines décisions sont simples à prendre, alors que d’autres sont beaucoup plus complexes, en ce sens qu’elles engagent un nombre de variables plus ou moins important (choisir entre pile ou face versus choisir des placements pour ses économies) et qu’elles peuvent avoir des conséquences plus ou moins lourdes (perdre par exemple un euro versus perdre plusieurs milliers d’euros). Source : https://www.cairn.info/revue-de-neuropsychologie-2013-2-page-69.htm.

Au sens le plus large, la notion de prise de décision peut concerner tout organisme vivant doté d'un système nerveux. Ce processus est activé lorsque nous ressentons le besoin d'agir sans savoir comment diriger notre action ou face à plusieurs choix.

Il s'agit d'une méthode de raisonnement pouvant s'appuyer sur des arguments (rationnels et/ou irrationnels), et qui peut éventuellement conduire à une non-décision ou un report (argumenté) de décision. Préférer s'en remettre au hasard (tirer à pile ou face) peut aussi résulter d'une prise de décision.

Le modèle d’incrémentalisme disjoint (rationalité a posteriori), aussi appelé modèle du gradualisme segmenté, a surtout été élaboré par Lindblom (1979), pour expliquer les prises de décisions au sein des gouvernements (Rajagopalan et Rasheed, 1995). Ce modèle réfère à une succession d’approximations visant à résoudre un problème, plutôt qu’à une programmation exacte, et suppose que les décideurs suivent un processus graduel et par palier, fondé sur une rationalité a posteriori. Le modèle d’incrémentalisme disjoint proposé par Lindblom (1979) s’applique aux systèmes dits ouverts, dans lesquels il est impossible a priori de définir, ni de pleinement comprendre, l’ensemble des variables qui affectent une décision : la prise de décision est principalement adaptative et réactive (Nutt, 1976).

Cependant, plusieurs recherches montrent que dans certaines situations (obligation d'une action rapide ou impossibilité de connaître certaines informations), les experts peuvent privilégier leur intuition peut être selon des principes de logique floue que les systèmes d'aide à la décision tentent aussi d’intégrer. D'autres chercheurs comme Gary Klein estiment que l'intuition constitue la base du processus décisionnel d'un expert. Ce dernier se réfère pour à ses expériences passées pour une décision. Dans certains cas, le lien entre la situation passée et la situation vécue est inconscient : on parle alors d'intuition. La vie quotidienne fait constamment appel à la prise de décision : organiser ses études, son métier, son orientation professionnelle, faire les courses, voter, etc. source : https://fr.wikipedia.org/wiki/Prise_de_décision

À l'échelle des collectivités, la démocratie participative et la conférence de citoyens sont des exemples de nouvelle gouvernance de la décision.

La décision n'est pas nécessairement exprimée (mais elle doit être consciente). L'observation du comportement extérieur peut renseigner sur l'état du processus de décision (expression non verbale). La prise de décision est un processus cognitif complexe visant à la sélection d’un type d’action parmi différentes alternatives. Cette théorie est appelée théorie de prise de décision.

On peut distinguer différents modes de décision :

- Autoritaire : un seul membre prend la décision.
- Majoritaire : le groupe le plus nombreux prend la décision pour tous.
- Minoritaire : un sous-groupe moins nombreux prend la décision pour tous.
- Unanimité : l’ensemble des membres est d’accord.
- Compromis : l'ensemble des membres se mettent d'accord, sur la solution acceptable par tous mais pas toujours satisfaisante.
- Consentement : les membres sont invités à exprimer une opposition justifiée, avec des risques avérés, et sinon de convenir à ne pas s'y opposer.
- Consensuelle : les membres d'un groupe cherchent à se mettre d'accord sur la base d'une analyse approfondie d'arguments discutés, en essayant d'éviter les biais cognitifs (voir conférence de consensus).

Il existe différents niveaux de décision qui doivent être pris dans une entreprise :

- Décisions stratégiques : engagent l’entreprise sur une longue période (plus de 5 ans). Les décisions sont prises par le plus haut niveau hiérarchique, c’est-à-dire soit par la Direction Générale, soit par l’État. Ces décisions sont uniques, occasionnelles.
- Décisions tactiques : engagent l’entreprise à moyen terme (de 2 à 5 ans). Les décisions sont prises par les encadrements supérieurs. Ces décisions sont peu fréquentes, peu prévisibles.
- Décisions opérationnelles : engagent l’entreprise à court terme (moins de 2 ans). Les décisions sont prises par les exécutants. Ces décisions sont fréquentes, très prévisibles.

Tableau 1: Etude des niveaux de décision

Abbildung in dieser Leseprobe nicht enthalten

Les décisions dans l’entreprise sont liées aux activités qui s’y déroulent. Anthony (1966) distingue 3 niveaux d’activités managériales :

Abbildung in dieser Leseprobe nicht enthalten

Figure 1 : Pyramide des niveaux d'activités dans l'entreprise

Source : [E. Bernard,] E. Bernard « Introduction aux Systèmes Interactifs d’Aide à la Décision » 2014

Pour étudier comment les dirigeants de l’entreprise prennent des décisions, Simon (1960) propose une typologie des décisions :

- Décision programmables : décision répétitives et routinières, et une procédure a été définie pour les effectuer, évitant ainsi d’avoir à les reconsidérer chaque fois qu’elles se présentent.
- Décision non programmables : il n’a pas été possible de définir une procédure spécifique pour les effectuer ; soit du fait qu’elles sont nouvelles, non structurées, inhabituelles,

L'illustration suivante a été supprimée pour des raisons de droits d'auteur.

Figure 2: Pyramide de la typologie de prise de décision [Bernard, 2014]

Attention : ne pas confondre décisionnel et transactionnel

Le tableau 2 suivant résume de façon non exhaustive les différences qu’il peut y avoir entre les systèmes transactionnels et les systèmes décisionnels selon les données et l’usage fait des systèmes.

Tableau 2: Tableau comparatif entre les systèmes transactionnels et les systèmes décisionnels

Abbildung in dieser Leseprobe nicht enthalten

Source : https://fr.slideshare.net/hamzus/document-1295639592

Ces différences font ressortir la nécessité de mettre en place un système répondant aux besoins décisionnels. Ce système n’est rien d’autre que le « Data Warehouse ».

I.2 Systèmes d’aide à la prise de décision moderne

Les systèmes d’aide à la prise de décision de nos jours sont fondés sur généralement 05(cinq) grands concepts (Business Intelligence, Data Warehouse, Data integration, synchronisation des données et l’analyse en ligne des données) qui dépendent les uns des autres et ne sont pas tous obligatoires. Leurs agencements dépendent du résultat attendu et des contraintes du milieu où ils doivent être appliqués.

I.2.1 Informatique Décisionnelle

L’informatique décisionnelle (en anglas business intelligence (BI) ou decision support system (DSS)) est l'informatique à l'usage des décideurs et des dirigeants d'entreprise. Elle désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données, matérielles ou immatérielles, d'une entreprise en vue d'offrir une aide à la décision et de permettre à un décideur d’avoir une vue d’ensemble de l’activité traitée. En d’autres termes, la Business Intelligence est le processus d’analyse de données dirigé par la technologie dans le but de déceler des informations utilisables pour aider les dirigeants d’entreprises et autres utilisateurs finaux à prendre des décisions plus informées.

Ce type d’application repose sur une architecture commune dont les bases théoriques viennent principalement de Ralph Kimball, Bill Inmon et DanLinstedt. Les étapes sont :

- Les données opérationnelles sont extraites périodiquement de sources hétérogènes : fichiers plats, fichiers Excel, base de données (DB2, Oracle, SQL Server, etc.), service web, données massives et stockées dans un entrepôt de données.
- Les données sont restructurées, enrichies, agrégées, reformatées, nomenclatures pour être présentées à l'utilisateur sous une forme sémantique (vues métiers ayant du sens) qui permet aux décideurs d'interagir avec les données sans avoir à connaître leur structure de stockage physique, de schémas en étoile qui permettent de répartir les faits et mesures selon des dimensions hiérarchisées, de rapports pré-préparés paramétrables, de tableaux de bords plus synthétiques et interactifs.
- Ces données sont livrées aux divers domaines fonctionnels (direction stratégique, finance, production, comptabilité, ressources humaines, etc.) à travers un système de sécurité ou de data mart spécialisé à des fins de consultations, d'analyse, d'alertes prédéfinies, d'exploration de données, etc.

L’informatique décisionnelle s’insère dans l’architecture plus large d’un système d'information. Mais n’est pas un concept concurrent du management de système d’information. Au même titre que le management relève de la sociologie et de l'économie, la gestion par l'informatique est constitutive de deux domaines radicalement différents que sont le management et l'informatique. Afin d'enrichir le concept avec ces deux modes de pensées, il est possible d'envisager un versant orienté ingénierie de l'informatique portant le nom d'informatique décisionnelle, et un autre versant servant plus particulièrement les approches de gestion appelé management du système d'information.

Actuellement, les données applicatives métier sont stockées dans une (ou plusieurs) base(s) de données relationnelle(s) ou non relationnelles. Ces données sont extraites, transformées et chargées dans un entrepôt de données généralement par un outil de type ETL (Extract-Transform-Load).

Un entrepôt de données peut prendre la forme d’un DW ou d’un data mart. En règle générale, le data warehouse globalise toutes les données applicatives de l’entreprise, tandis que les data marts (généralement alimentés depuis les données du DW) sont des sous-ensembles d’informations concernant un métier particulier de l’entreprise (marketing, risque, contrôle de gestion…), des usages spécifiques (analyse, reporting...), ou encore répondent à des exigences ou contraintes particulières (cloisonnement des données, volumétrie...). Le terme comptoir de données ou magasin de données est aussi utilisé pour désigner un data mart.

Les entrepôts de données permettent non seulement de produire des rapports qui répondent à la question « Que s’est-il passé ? », mais ils peuvent être également conçus pour répondre à la question analytique « Pourquoi est-ce que cela s’est passé ? », Et à la question pronostique « Que va-t-il se passer ? ». Dans un contexte opérationnel, ils répondent également à la question « Que se passe-t-il en ce moment ? », voire dans le cas d’une solution d’entrepôt de données actif « Que devrait-il se passer ? ». La courbe suivante représente l’évolution de BI.

Abbildung in dieser Leseprobe nicht enthalten

Figure 3: Evolution de la Business Intelligence en 4 étapes

Source : https://www.decivision.com/evolution-business-intelligence

Le reporting est probablement l'application la plus utilisée encore aujourd'hui de l’informatique décisionnelle, il permet aux gestionnaires :

- De sélectionner des données relatives à telle période, telle production, tel secteur de clientèle, etc.
- De trier, regrouper ou répartir ces données selon les critères de leur choix.
- De réaliser divers calculs (totaux, moyennes, écarts, comparatif d'une période à l'autre…).
- De présenter les résultats d’une manière synthétique ou détaillée, le plus souvent graphique selon leurs besoins ou les attentes des dirigeants de l’entreprise.

Abbildung in dieser Leseprobe nicht enthalten

Figure 4: Schéma décrivant le processus de générale d'extraction des données jusqu'au BI

Source : https://www.piloter.org/business-intelligence/business-intelligence.htm

Les programmes utilisés pour le reporting permettent bien sûr de reproduire de période en période les mêmes sélections et les mêmes traitements et de faire varier certains critères pour affiner l’analyse. Mais le reporting n'est pas à proprement parler une application d'aide à la décision. L'avenir appartient plutôt aux instruments de type tableau de bord équipés de fonctions d’analyses multidimensionnelles de type l'OLAP. Fonction OLAP qui peut être obtenue de différentes façons par exemple via une base de données relationnelle R-OLAP, ou multidimensionnelle M-OLAP, voire aussi en H-OLAP.

Les data mart et/ou les DW peuvent ainsi permettre via l'OLAP l’analyse très approfondie de l’activité de l’entreprise, grâce à des statistiques recoupant des informations relatives à des activités apparemment très différentes ou très éloignées les unes des autres, mais dont l’étude fait souvent apparaître des dysfonctionnements, des corrélations ou des possibilités d’améliorations très sensibles. L'interopérabilité entre les systèmes d'entrepôt de données, les applications informatiques ou de gestion de contenu, et les systèmes de reporting est réalisée grâce à une gestion des métadonnées.

L'informatique décisionnelle s'attache à :

- Mesurer un certain nombre d'indicateurs ou de mesures (que l'on appelle aussi les faits)
- Restituer selon les axes d'analyse, que l'on appelle usuellement les dimensions.

Par exemple, on peut vouloir mesurer:

- Trois faits : le chiffre d'affaire, le nombre de ventes, le montant de taxes pour les ventes de produits
- Selon une première dimension, le calendrier : par année, par trimestre, par mois, par jour ;
- Et selon une deuxième dimension, la hiérarchie de produits : famille de produits, gamme de produits, référence produit.

On obtient ainsi un tableau à deux entrées :

- Par exemple en lignes : la nomenclature produite à 3 niveaux (famille, gamme, référence)
- Et en colonnes : les années, décomposées en trimestres, décomposées en mois
- Avec au croisement des lignes et colonnes, pour chaque cellule : le chiffre d'affaire, le montant de taxes et le nombre de ventes

Si l'on s'intéresse à une troisième dimension d'analyse, par exemple, la hiérarchie géographique des points de vente (par pays, région, magasin) on passe ainsi à un cube. Les tableaux croisés dynamiques d'Excel permettent de représenter ce type de cube avec le champ "page", qui présente les données agrégées pour chaque niveau hiérarchique et pour chaque dimension.

Si l'on s'intéresse à un axe d'analyse supplémentaire, par exemple la segmentation des clients (par catégorie, profession, client), on obtient alors un cube à plus de 3 dimensions, appelé hyper cube. Le terme cube est souvent utilisé en lieu et place d’hyper cube.

Chacune de ces vues partielles du cube se traduit finalement, soit par un tableau à double entrée (tri croisé), soit par un graphique le plus souvent bidimensionnel. Ainsi, bien que la navigation dans le cube soit multidimensionnelle, le décideur n’a pas, en réalité, accès à une synthèse, mais à une multitude de tris croisés ou de vues bidimensionnelles dont l’exploration, longue et fastidieuse, est parfois court-circuitée faute de temps. Cela peut conduire à de coûteuses erreurs de décision.

Aussi il peut être utile d’associer à cette démarche une iconographie des corrélations, qui permet une vue d’ensemble réellement multidimensionnelle, débarrassée des redondances.

Un système d'information décisionnel (SID) doit être capable d'assurer quatre fonctions fondamentales : la collecte, l’intégration, la diffusion et la présentation des données. À ces quatre fonctions s'ajoute une fonction d'administration, soit le contrôle du SID lui-même. Ceci nous amène à répondre aux questions suivantes :

- Comment fonctionne les outils décisionnels aujourd'hui ?

Depuis quelques années, les plateformes de BI bénéficient des bases NoSQL, qui leur permettent de traiter directement des données non-structurées. Les applications de Business Intelligence bénéficient, aussi, d'architecture matérielle plus puissante, avec l'émergence des architectures 64 bits, du multi-cœur, et du traitement en mémoire vive (in-memory).

Elles peuvent ainsi exécuter de manière plus rapide des traitements complexes, tels des modèles prédictifs (data mining) et des analyses multidimensionnelles - qui consistent à modéliser des données selon plusieurs axes (chiffre d'affaires / zone géographique, catégorie de client, de produit...).

- Quels champs sont couverts par la BI ?

Traditionnellement centrée sur les questions comptables (consolidation et planification budgétaire), la BI s'est petit à petit étendue à l'ensemble des grands domaines de l'entreprise, de la gestion de la relation client à la gestion de la chaîne logistique en passant par les ressources humaines. Des éditeurs spécialisés ont défini des bibliothèques d'indicateurs prêts-à-l ‘emploi permettant de suivre ces différentes activités. Pour finir, l'apparition de nouvelles technologies web (dont HTML5 et les interfaces graphiques JavaScript et AJAX) a permis, aussi, l'émergence de nouveaux acteurs proposant une approche de la BI en mode cloud ou Saas.

I.2.2 Entrepôt de données

Les DW sont des bases de données permettant de stocker des données historiques structurées non volatiles orientées sujet afin de les analyser. Découvrez la définition, les avantages, et les cas d’usage des DW.

Une DW est une base de données relationnelle pensée et conçue pour les requêtes et les analyses de données, la prise de décision et les activités de type Business Intelligence sont davantage que pour le traitement de transactions ou autres usages traditionnels des bases de données. Les informations stockées dans la DW sont historiques, et offrent une vue d’ensemble des différentes transactions qui ont eu lieu au fil du temps. Les données redondantes sont souvent incluses dans les DW pour offrir aux utilisateurs plusieurs vues sur l’information. C’est la raison pour laquelle les données stockées dans la DW sont souvent agrégées pour permettre aux utilisateurs d’y accéder plus facilement.

En plus d’une base de données relationnelle, un environnement DW intègre un outil d’extraction, de transport, de transformation et de chargement de données (ETL). On retrouve aussi un moteur de traitement analytique en ligne (OLAP), des outils d’analyse client, et d’autres applications permettant de gérer le traitement des données collectées.

L’une des principales particularités d’une DW est que les informations y sont classées par sujets (clients, produits…). De fait, ce qui définit réellement une DW est le type de données qu’elle contient et les personnes qui l’utilisent.

L'illustration suivante a été supprimée pour des raisons de droits d'auteur.

Figure 5: Architecture global d’un Data Warehouse

Quels types de données sont stockés dans une DW ?

Les données stockées dans une DW présentent plusieurs spécificités. Elles sont séparées des systèmes opérationnels, mais aussi accessibles et disponibles pour les requêtes. Dernière caractéristique des DW, elles doivent être time-variant. Cela signifie qu’elles permettent de focaliser les analyses sur les changements survenus au fil du temps à partir de larges ensembles de données, afin de découvrir des tendances. C’est ce qui oppose les DW aux systèmes OLTP dont les données opérationnelles sont atomiques et ne reflètent que la valeur actuelle de la dernière transaction.

On distingue quatre types de DW : les systèmes de gestion de base de données (SGBD) relationnelles traditionnels, les SGBD relationnelles spécialisés, les DW Appliances et les DW Cloud. Les SGBD sont les DW les plus courantes. Dans la plupart des cas, on utilise un SGBD relationnel, mais il convient de noter que n’importe quel type de SGBD peut être utilisé. Dans la plupart des cas, un SGBD de DW propose plusieurs fonctionnalités et caractéristiques additionnelles permettant de les utiliser efficacement pour les activités et opérations de Data Warehousing. Une plateforme DW peut aussi embarquer des logiciels additionnels. On parle là de SGBD de vendeurs comme IBM, Microsoft, Oracle ou SAP. Les SGBD spécialisées quant à elles se distinguent des SGBD traditionnels par la façon dont elles ont été améliorées pour pouvoir prendre en charge les workloads DW. Ces produits sont proposés par des vendeurs comme HP et SAP.

Les quatre caractéristiques des DW selon leur inventeur William H. Inmon. Selon William H. Inmon, l’inventeur du terme, les DW présentent quatre caractéristiques spécifiques. Elles doivent être orientées sujet, intégrées, non volatiles et « time-variant ».

Les DW doivent être orientées sujet, ce qui signifie qu’il doit être possible de les définir par leur sujet. Par exemple, un Data Warehouse peut être déployé spécialement pour analyser les données liées aux ventes de l’entreprise. Cette DW servira à répondre à des questions comme « quels ont été les meilleurs clients pour tel produit au cours de l’année précédente ».

Dans la même logique, la DW doit être en mesure d’assembler des données en provenance de différentes sources dans un format consistant. Elles doivent permettre de résoudre les problèmes comme les conflits de noms et les incohérences en termes d’unités de mesure. On parle là d’intégration.

Troisièmement, les DW doivent être non-volatiles. Cela signifie qu’une fois qu’une donnée est entrée dans la DW, elle ne doit plus changer. L’utilisateur est ainsi en mesure d’analyser les données.

Les Data Warehouses Appliances sont conçues pour délivrer des services de Data Warehousing clé en main directement. En général, ces produits combinent logiciel et matériel avec une SGBD relationnelle ou analytique préinstallée et configurée sur le hardware requis. Le serveur est configuré avec la bonne quantité de mémoire et de stockage, et le SGBD est installé par le vendeur. L’utilisateur se contente de brancher le matériel et de l’allumer. On peut citer comme exemple les produits de Teradata, IBM et Oracle.

Dans la dernière catégorie, celle des Data Warehouses Cloud, le SGBD n’est pas installé sur site. L’utilisateur y accède via internet. On parle là de « Data Warehouse en tant que Service », de la famille des XaaS. L’utilisateur n’a pas besoin de disposer d’un SGBD ou de matériel dédié sur site. Les leaders du marché des DW cloud sont Microsoft, Amazon et IBM.

Précisons que l’on compte aussi de plus en plus de solutions hybrides intégrant diverses capacités de stockage et d’accès aux données pour les données structurées et non structurées. On peut citer les vendeurs Actian et Pivotal.

Par ailleurs, ces différents types de plateformes Data Warehouses peuvent être déployés de plusieurs façons : Enterprise Data Warehouse (EDW), Data Mart, ou une combinaison des deux.

Une EDW est utilisée à l’échelle d’une entreprise entière, tandis qu’un Data Mart est plus petit et focalisé sur les besoins individuels ou spécifiques à un département. De même, en fonction de la taille de l’entreprise, il est possible de créer plusieurs Data Marts et les intégrer avec une EDW.

Grâce à l’Online Analyticial Processing (OLAP), les entreprises sont en mesure de dégager des insights de leurs opérations par le biais d’un accès interactif et itératif aux données stockées. Ceci permet aux responsables des entreprises d’améliorer les prises de décisions en effectuant des requêtes pour examiner les processus, les performances et les tendances de leurs entreprises.

Une DW peut être utilisée pour suivre, gérer et améliorer les performances d’une entreprise. Elle peut être utilisée pour suivre et modifier une campagne marketing. On peut s’en servir pour passer en revue et optimiser la logistique et les opérations, ou pour améliorer l’efficacité du développement de produit.

Les entreprises utilisent aussi les DW pour lier et accéder aux informations en provenance de sources multiples. Ces solutions permettent aussi de gérer et d’améliorer les relations clients. Les DW peuvent permettre de prédire les futures tendances et besoins, et enfin d’améliorer la qualité des données.

Les DW présentent de nombreux avantages. Pour les responsables informatiques, elles permettent notamment de séparer les processus analytiques des processus d’exploitation pour améliorer les performances dans ces deux domaines.

Pour les entreprises, une plateforme DW est une façon pratique de visualiser le passé sans affecter les opérations quotidiennes. En effectuant des requêtes et des analyses de données au sein de la Data Warehouse, les entreprises peuvent améliorer leurs opérations et leur efficience, et ainsi augmenter leurs revenus et leurs bénéfices.

Les DW sont utilisées depuis près de 30 ans. Depuis peu toutefois, les Data Lakes gagnent en popularité à tel point que certains pensent qu’ils vont remplacer les Warehouses. En réalité, il convient de garder en tête que ces deux types de systèmes présentent d’importantes différences et ne sont pas utilisés de la même façon.

Une DW rassemble une grande quantité de données accumulées au sein d’une entreprise en provenance de différentes sources de données. Elle est utilisée pour prendre des décisions. De son côté, le Data Lake est une banque de stockage servant à contenir une immense quantité de données brutes dans leur format d’origine jusqu’à ce que l’entreprise en ait besoin. Data Lakes et DW se distinguent sur plusieurs points : les données, le traitement des données, le stockage, l’agilité, la sécurité et les utilisateurs.

Les DW ne peuvent accueillir que des données structurées. Un Data Lake est capable de stocker des données structurées, semi-structurées, ou non structurées. En ce qui concerne le traitement des données, les données chargées dans une DW doivent passer par l’étape du schema-on-write qui consiste à leur conférer une forme et une structure (un modèle). Dans le cas des Data Lakes, les données sont stockées sous leur forme brute et l’utilisateur leur donne forme en cas de besoin. C’est ce qu’on appelle le schema-on-read.

Le stockage dans une Data Warehouse peut être cher, surtout si le volume de données est large. Le stockage sur Data Lake revient souvent moins cher, car la plupart des technologies Big Data reposent sur des logiciels open source conçus pour être installés sur du matériel low-cost.

Une DW est une banque de données structurée. Il n’est donc pas difficile techniquement de changer la structure. Cependant, ce processus peut prendre du temps en fonction des business processes qui y sont attachées. Contrairement à la DW, le Data Lake n’a pas de structure. De fait, les Data Developers et Data Scientists peuvent aisément configurer et reconfigurer les modèles de données, les requêtes et les applications. Les DW sont donc moins agiles.

En revanche, en termes de sécurité, les DW profitent de leur ancienneté et de leur maturité.

Les données sont moins sécurisées au sein d’un Data Lake, même si des progrès sont effectués dans ce domaine. La dernière différence entre DW et Data Lakes sont les utilisateurs auxquels ils se destinent. Les DW sont principalement utilisées par les responsables d’entreprises, tandis que les Data Lakes sont généralement utilisés par des Data Scientists dans des secteurs scientifiques.

I.2.3 Intégration des données ou ‘’Data intégration’’ (DI)

L’intégration des données consiste à combiner les données résidant dans différentes sources et fournissant aux utilisateurs une vue unifiée d'entre eux. Ce processus est important dans une variété de situations, qui comprennent à la fois commerciales (par exemple lorsque deux entreprises similaires doivent fusionner leurs bases de données) et scientifiques (combinant les résultats de recherche de différents bio - informatique domaines référentiels, par exemple). L’intégration des données apparaît avec une fréquence croissante que le volume (qui est, gros volumes de données) et la nécessité de partager des données existantes explose. Il est devenu l'objet de travaux théoriques vastes, et de nombreux problèmes ouverts restent sans solution.

L'illustration suivante a été supprimée pour des raisons de droits d'auteur.

Figure 6: Schéma fonctionnel du data intégration

Ainsi nous distinguons trois approches d’intégration avec leurs avantages et inconvénients à savoir : ETL, EII et EAI.

L’ETL permet la consolidation des données à l’aide des trois opérations suivantes :

- Extraction : Identifier et extraire les données de sources ayant subi une modification depuis la dernière exécution
- Transformation : Appliquer diverses transformations aux données pour les nettoyer, les intégrer et les agréger
- Chargement : Insérer les données transformées dans l’entrepôt et gérer les changements aux données existantes.

Il traite normalement de grandes quantités de données en lots et est surtout utilisé avec les entrepôts de données et les comptoirs de données.

L'illustration suivante a été supprimée pour des raisons de droits d'auteur.

Figure 7: Architecture fonctionnelle d'un ETL

Avantage:

- Optimiser pour la structure de l’entrepôt de données
- Pouvoir traiter de grandes quantités de données dans une même exécution (traitement en lot)
- Permettre des transformations complexes et agrégations sur les données
- Etre contrôlée par l’administrateur
- Permettre la réutilisation des processus et transformations (ex : Package dans SSIS)

Inconvénients:

- Processus de développement long et coûteux
- Gestion des changements nécessaire
- Exigences de l’espace disque pour effectuer les transformations
- Exécution indépendamment du besoin réel
- Latence des données entre la source et l’entrepôt
- Unidirectionnel (des sources vers l’entrepôt de données)

L’EII fournit une vue unifiée des données de l’entreprise où les sources de données forment une fédération. Les sources de données dispersées sont consolidées à l’aide d’une BD virtuelle, de manière transparente aux applications utilisant ces données.

Toute requête à la BD virtuelle est décomposée en sous-requête aux sources respectives, dont les réponses sont assemblées en un résultat unifié et consolidé. Il permet aussi de consolider uniquement les données utilisées, au moment où elles sont utilisées (Source Data Pulling). Le traitement en ligne des données peut cependant entraîner des délais importants.

Avantage:

- Avoir un accès relationnel à des sources non-relationnelles
- Permettre d’explorer les données avec la création du modèle de l’entrepôt de données
- Accélérer le déploiement de la solution
- Pouvoir être réutilisé par le système ETL dans une itération future

Inconvénients:

- Requiert la correspondance des clés d’une source à l’autre
- Consolidation des données plus complexe que dans l’ETL
- Surtaxe les systèmes sources
- Plus limité que l’ETL dans la quantité de données pouvant être traitée
- Transformations limitées sur les données
- Consommation d'une grande bande passante du réseau

L’EAI est une approche permettant de fournir à l’entrepôt de données des sources (data pushing). Il repose sur l’intégration et le partage des fonctionnalités des applications sources à l’aide d’une architecture SOA. De plus, il est généralement utilisé en temps réel ou semi-réel (Near Real Time). L’EAI ne remplace pas le processus ETL mais permet de simplifier ce dernier.

Avantage:

- Faciliter l’interopérabilité des applications
- Permettre l’accès en quasi temps réel
- Ne transférer que les données nécessaires
- Contrôler le flot d’information

Inconvénients:

- Support limité aux transformations et agrégations des données
- Taille des transactions limitée (en nombre de lignes)
- Développement complexe
- Gestion complexe de l’intégrité sémantique des données
- Utilisation de la bande passante du réseau durant les heures de pointe

L'illustration suivante a été supprimée pour des raisons de droits d'auteur.

Figure 8: Architecture fonctionnelle des EAI

Quand utiliser les approches d’intégrations ?

- Pour ETL
- Consolidation d’une grande quantité de données
- Transformations complexes

- Pour EII
- Relier un entrepôt (EDW) existant avec des données de sources spécifiques
- Données sources volatiles et accessibles à l’aide de requêtes simples (EX : SQL)

- Pour EAI
- Intégration de transactions
- Requêtes analytiques simples
- Sources non-accessibles directement

Tableau 3: Synthèse entre les différentes méthodes d'intégration

Abbildung in dieser Leseprobe nicht enthalten

Source : https://fr.m.wikiversity.org/wiki/Fichier:Krisangel-Synth%C3%A8se.png

I.2.4 Synchronisation des données

La Synchronisation a pour but de faire correspondre le contenu de deux sources de données. La synchronisation des données n’est pas loin de l’intégration des données. Nous pouvons faire une différence entre un processus d’intégration des données et un processus de synchronisation des données:

- L’intégration se fait généralement entre diverses bases de données de production (utilisées par les services actifs de l’entreprise) vers une base de données d’analyse qui n’est pas en production (pour l’analyse des données)
- La synchronisation a généralement lieu entre deux ou plusieurs bases de données de production. On utilise généralement la synchronisation dans un système d’informations lorsque l’ensemble des applications de ce système ont des fonctions communes. Afin d’éviter toute redondance des traitements, on centralise l’insertion de la donnée sur une source et on repend la donnée instantanément sur les autres sources de données afin qu’elles se mettent à jour.

Il existe plusieurs systèmes de synchronisation des données :

- Les ETL (Extract, Transform and Load) : Ils permettent la consolidation des données et traitent généralement une grande quantité de données, ce que l’on désigne souvent par le terme entrepôts des données.
- Les EAI (Entreprise Application Integration) L’EAI est une approche permettant de fournir à l’entrepôt de données des sources (Data pushing). Il repose sur l’intégration et le partage des fonctionnalités des applications sources à l’aide d’une architecture SOA. De plus, il est généralement utilisé en temps réel ou semi-réel (Near Real Time). L’EAI ne remplace pas le processus ETL mais permet de simplifier ce dernier.
- Les Web Services (ESB, SOA) : Les services web sont une méthode d’échange d’informations à travers le web entre différentes applications. Les services web rendent les applications interopérables, car il utilise le plus souvent un format de données internationales (XML, HTTP). On peut utiliser les services web lorsque le flot de données à échanger n’est pas très volumineux. Le tableau ci-dessous présente une synthèse des différentes techniques de synchronisation des données :

Tableau 4: Synthèse des différentes techniques de synchronisation

Abbildung in dieser Leseprobe nicht enthalten

I.2.5 Analyse en ligne des données (OLAP et OLTP)

Le terme OLAP (On-Line Analytical Processing) désigne une classe de technologies conçue pour l’accès aux données et pour une analyse instantanée de ces dernières, dans le but de répondre aux besoins de Reporting et d’analyse.

R. Kimball définit le concept « OLAP » comme «Activité globale de requêtage et de présentation de données textuelles et numériques contenues dans l’entrepôt de données ; Style d’interrogation spécifiquement dimensionnel » [Kimball, 2005].

C’est en continuant sur sa lancée, qui lui a permis de définir le model OLTP (On Line Transaction Processing) pour les bases de données relationnelles, que le concept OLAP fut introduit et défini en 1993 par E.F Codd, le père des bases de données relationnelles, dans un document technique portant le titre de « Providing OLAP (On-Line Analytical Processing) to User-Analysts: An IT Man-date » [Codd, 1993].

Le noyau d’un système OLAP est son serveur. Ces serveurs sont classés selon la politique régissant l’architecture du serveur. Ainsi, ces architectures peuvent être distinguées comme suit :

- Les systèmes à architecture MOLAP

Ces systèmes MOLAP « Multidimentional On-line Analytical Processing » sont conçus exceptionnellement pour l’analyse multidimensionnelle.

R. Kimball définit ces systèmes comme étant un « Ensemble d’interfaces utilisateur, d’applications et de technologies de bases de données propriétaire dont l’aspect dimensionnel est prépondérant » [Kimball, 2005].

Ainsi donc cette base adopte réellement la structure multidimensionnelle, exploitant de ce fait ces capacités au maximum. En effet MOLAP offre des temps d’accès optimisés et cela en prédéfinissant les opérations de manipulation et de chemin d’accès prédéfinis.

Autre caractéristique du MOLAP c’est qu’il agrège tout par défaut, pénalisant du coup le système lorsque la quantité de données à traiter augmente. On parle généralement de volume de l’ordre du giga-octet pas plus.

Abbildung in dieser Leseprobe nicht enthalten

Figure 9: Principe de l’architecture MOLAP [Nakache, 1998].

Source : https://fr.slideshare.net/hamzus/document-1295639592

- Les systèmes à architecture ROLAP « Ensemble d’interfaces utilisateurs et d’applications qui donnent une vision dimensionnelle à des bases de données relationnelles » [Kimball, 2005].

Les systèmes ROLAP « Relationnel On-line Analytical Processing » sont en mesure de simuler le comportement d’une SGBD multidimensionnel en exploitant un SGBD relationnel. L’utilisateur aura ainsi l’impression d’interroger un cube multidimensionnel alors qu’en réalité il ne fait qu’adresser des requêtes sur une base de données relationnelles.

ROLAP n’agrège rien. Les règles d’agrégations sont créées au préalable et représentées dans une table relationnelle ce qui cause une lourdeur d’administration mais confère une certaine performance et un gage de cohérence lors de l’utilisation.

Cette structure est généralement adoptée dans le but de se dispenser de l’acquisition d’un SGBD relationnel.

Abbildung in dieser Leseprobe nicht enthalten

Figure 10:Principe de l’architecture ROLAP [Nakache, 1998].

Source : https://fr.slideshare.net/hamzus/document-1295639592

- Les systèmes à architecture HOLAP Les systèmes HOLAP « Hybride On-line Analytical Processing » sont une sorte de compromis entre les différents systèmes précités. Cette combinaison donne à ce type de système les avantages du ROLAP et du MOLAP en utilisant tour à tour l’un ou l’autre selon le type de données.
- Autres architectures OLAP

Bien que les architectures évoquées ci-dessus soient les plus répandues et les plus adoptées par les fournisseurs de solutions OLAP. D’autres systèmes se basent sur des architectures différentes telles que l’architecture OOLAP « Object On-line Analytical Processing », ou alors DOLAP « Desktop On-line Analytical Processing » qui décrit une catégorie de produits qui ne sont pas nécessairement connectés à un serveur et qui s’appuient sur une source de données (un cube) construites, stockées et exploitées en local sur la machine de l’utilisateur.

Une synthèse comparative entre OLAP et OLTP est dans le tableau suivant:

Tableau 5: Synthèse comparative entre OLAP et OLTP

Abbildung in dieser Leseprobe nicht enthalten

Source : https://fr.slideshare.net/hamzus/document-1295639592

I.3 Généralités sur les campagnes marketing et les campagnes commerciales

I.3.1 Notion de campagnes Marketing

Une campagne marketing vise à transmettre un message, un message qui va de la marque vers les clients. Une campagne marketing est un acte de communication, elle se définit par la nature du message transmis. Ce message peut être informatif, pédagogique, promotionnel. En d’autre terme, une campagne marketing est un ensemble organisé d’actions destiné à atteindre un objectif précis. Pour approfondir cette définition, le plus simple est d’énumérer les principaux attributs d’une campagne marketing. Une campagne marketing se définit par:

Un exemple de reporting des performances d’une campagne marketing. Un dispositif de reporting suppose la sélection des indicateurs.

- Un ou des objectifs, par exemple:
- Promouvoir un nouveau produit, un nouveau service, une nouvelle gamme.
- Recueillir des feedbacks clients.
- Communiquer sur un événement: ouverture d’un nouveau magasin, fermeture d’un magasin, soldes,
- Des indicateurs permettant de mesurer la performance de la campagne marketing, c’est-à-dire d’évaluer dans quelle mesure cette campagne a permis d’atteindre les objectifs que l’entreprise s’était fixés.
- Une cible. Une campagne marketing s’adresse rarement à tous les clients en base, elle cible des segments clients précis, caractérisés par un certain nombre d’attributs sociodémographiques, comportementaux…
- Une portée (un reach). Une campagne peut être réalisée au niveau local ou avoir une dimension nationale.
- Un message. Une campagne marketing vise à transmettre un message, un message qui va de la marque vers les clients. Une campagne marketing est un acte de communication, elle se définit par la nature du message transmis. Ce message peut être informatif, pédagogique, promotionnel. Il peut communiquer sur des contenus froids (des tutoriels par exemple) ou des contenus « chauds » (campagnes flash).
- Un canal. Quel canal ou media l’entreprise utilise-t-elle pour faire passer le message de la campagne ?

Les entreprises n’ont jamais eu autant de canaux à leur disposition : l’email, la publicité print (publicité dans des journaux, dans le métro, dans la rue, etc.), la publicité télé ou radio, la publicité digitale, les réseaux sociaux, le SMS, les applications mobiles, etc. Le choix du canal n’est pas anodin.

- Une temporalité, c’est-à-dire une date de début et une date de fin, avec éventuellement une récurrence. Une campagne marketing est caractérisée par une période de diffusion et, parfois, une fréquence.

D’autres attributs, secondaires, peuvent être utilisés pour définir et catégoriser les campagnes. Par exemple, une entreprise peut classer ses campagnes en fonction de leur univers lorsqu’elle possède une marque qui couvre plusieurs univers métiers / produits.

Comment créer une campagne marketing ? Les points à prendre en compte sont:

- Le but de votre campagne marketing

Il faut commencer par le commencement. Pourquoi voulez-vous créer cette campagne ? Quel objectif visez-vous ? Une campagne marketing, nous l’avons vu d’entrée de jeu, se caractérise par son objectif, L’objectif doit être mesurable mais il doit aussi être précis, pour que l’on puisse à la fin qualifier le succès ou l’échec de la campagne. Par exemple : collecter 1 000 feedbacks clients d’ici au 31 décembre 2020. Enfin, l’objectif doit être spécifique. De quel feedbacks clients parle-t-on ? Des commentaires sur les réseaux sociaux ? Des réponses à un questionnaire ? Une inscription à une enquête ?

Seuls les objectifs mesurables, précis et spécifiques sont atteignables.

- La mesurer de la performance de votre campagne marketing

En marketing, il est toujours important de mesurer l’efficacité des actions entreprises. C’est pour cette raison que vous devez absolument mesurer la performance de toutes vos campagnes marketing.

On mesure grâce à des indicateurs. Par exemple : le taux d’ouverture email, le nombre de likes Facebook, le nombre de retweets, le nombre de commandes, le nombre de réponse au questionnaire, etc.

- Votre vous ciblez

Vous devez définir ensuite la fameuse « audience cible ». Une campagne marketing est un acte de communication, c’est un message. Mais avec qui voulez-vous communiquer ? A qui s’adresse le message ? A qui vous parlez ? La forme et le contenu d’un message dépendent étroitement de la cible que l’on a choisie.

C’est pour cette raison qu’il faut déterminer la cible dès les premières phases de conception de la campagne marketing.

Le choix des canaux est lui aussi pour partie déterminé par la cible. Si votre campagne cible les seniors, il est a priori non pertinent de choisir les réseaux sociaux comme canal de diffusion. C’est un exemple caricatural mais qui a pour mérite de bien illustrer les liens entre cible et canaux.

- La campagne marketing

Nous allons maintenant parler de la campagne en tant que telle, de sa forme, de son contenu, du message.

Nous savons dorénavant quel est le but de la campagne, comment en mesurer la performance et à quel segment(s) client(s) elle s’adresse. Maintenant, il faut mettre les mains dans le cambouis. Cette étape fait appel à la créativité. Il s’agit de construire le design de la campagne et de rédiger le message, en choisissant les bons mots, le bon ton, le bon angle. Design et message doivent être engageants tout en restant en phase avec l’identité de la marque.

Certaines entreprises externalisent cette étape et confient la création des campagnes à des agences web.

D’autres recrutent des freelances designers, des concepteurs-rédacteurs spécialement préposés à la création des campagnes. Nos consultants CRM sont parfois amenés à conseiller les entreprises sur la meilleure option d’organisation. Il n’y a pas de solution meilleure en soi, tout dépend des objectifs de l’entreprise, de son organisation, de son fonctionnement, de ses ressources (temps, budget…).

- Choix message, canal et du media

Le choix du canal intervient en réalité assez tôt dans le processus de conception des campagnes marketing. Il détermine d’ailleurs l’étape de création des campagnes. On ne peut pas créer une campagne avant de savoir sur quel canal elle sera diffusée, car on ne créé pas un SMS comme on créé un email…Le choix du canal est structurant.

Le choix du canal dépend de plusieurs paramètres :

- Votre objectif. Si vous voulez collecter des feedbacks via votre questionnaire en ligne, vous n’allez pas diffuser votre campagne par voie postale.
- La cible de la campagne. Vous devez être très attentif aux préférences de vos clients. Si votre cible et jeune et très active sur les réseaux sociaux, diffuser une campagne marketing de prospection sur Facebook Ads peut faire sens. Vous devez être présent sur les canaux qu’utilisent vos clients, votre cible.
- L’historique de performance. Vous avez déjà diffusé des campagnes et analysé leur performance. Il y a forcément des canaux qui génèrent plus d’engagement que d’autres, plus de revenus, etc. Vous devez le prendre en compte.
- Votre budget. Certains canaux de diffusion sont très peu coûteux, c’est le cas de l’email par exemple. D’autres sont bien plus onéreux : télévision, radio, AdWords, courrier postal…Le choix du canal dépend aussi du budget que vous êtes prêt à allouer à la campagne. Source : https://www.custup.com/projet-crm-consultant-crm/plan-marketing-relationnel/campagne-marketing/

I.3.2 Notion Campagnes commerciales

Une action commerciale est une technique mise en place par un commerçant pour augmenter ses ventes. Une action commerciale peut s'adresser soit à des prospects, c'est-à-dire des personnes qui ne sont pas encore clientes, soit à des clients. Afin de développer son chiffre d'affaires, un commerçant doit mettre en place des actions commerciales en direction de prospects et en direction de ses clients. Ces actions commerciales peuvent prendre différentes formes et ont pour principal but d'augmenter les ventes.

Chapitre II : Etat des lieux du système actuel de gestion des campagnes markéting et commerciales

Il est question dans ce chapitre de présenter l’existant qui fera l’objet de notre travail sur divers aspects tels que : l’état fonctionnelle, le système de prise des décisions, les limites ou problèmes observés.

II.1 Brève présentation de l’entreprise

Multi Canal Service est une entreprise spécialisée dans le développement et d’intégration de solution logicielle. Elle est aussi une entreprise de conseil et de services spécialisée en deux disciplines :

- Marketing Management
- Management des systèmes et technologies d’information

Formée par des équipes multidisciplinaires de consultants et d’ingénieurs de haut niveau et une structure qui développe et propose des solutions performantes, réalistes, adaptées et facilement applicables. Elle est compartimentée en trois grands services : service informatique, service de livraison, service marketing et service commercial.

Le service informatique : il est chargé du développement des projets, de la formation des commerciaux aux outils du TIC et à la prise en main de nos logiciels de gestions et des produits développés, de l’administration des plateformes de l’entreprise.

Le service commercial : il est chargé de fournir le contenu des produits commerciaux développés par le service informatique, d’user de toutes stratégies marketing et de management pour vendre nos produits et services.

Le service de livraison : il est chargé est chargé d’acheminer les biens acquis ou encours d’acquisition au client et de finaliser les derniers détails de facturation comme la signature de la facturation et ou prendre la contrepartie du produit.

Tableau 6: Fiche signalétique de MCS

Abbildung in dieser Leseprobe nicht enthalten

Source : par nos soins

II.2 Etude du système actuel de gestion

II.2.1 Etat fonctionnel des processus métiers

II.2.1.1 Processus métier marketing

Objectif premier d’une entreprise est de vendre et se faire du profit. C’est dans cette optique que le service marketing et communication effectue quotidiennement des tâches afin que cet objectif soit atteint. Tous les moyens sont permis pour faire parler de soi et de ses services (campagnes publicitaires, création de contenus sur les réseaux sociaux, marketing direct…). De la mise en place d’un planning commercial, en passant par un planning de communication. Chaque action est mûrement pensée en marketing, car se faire connaître, se faire accepter et inciter les personnes à nous suivre dans notre vision n’est pas chose facile. Quelques tâches répétitives observées :

- Gestions des pages Facebook, Instagram, twitter et LinkedIn ;
- Conception des créas pour les graphistes ;
- Répartition des zones de prospection et définition des objectifs de vente ;
- Mise en place des campagnes de promotions.

II.2.1.2 Processus métier commercial

Le service commercial effectue quotidiennement des actions commerciales par le biais des agents commerciaux qui sont constamment sur le terrain afin de prendre contacts avec les prospects et par la même occasion présentes les services de l’entreprise, recueillir les données et de leur vendre. Il est aussi chargé de la gestion des litiges, des plaintes des clients et répartitions des zones de prospection. Enfin il organise périodiquement des sciences de formation et ou des meetings de motivation. Il assure aussi la gestion des entrées sorties des ventes de nos produits/services pour la tenue d’une comptabilité régulière. Il travaille aussi en parfaite communication avec le service marketing, technique et le service coursier pour.

II.2.1.3 Processus de support technique

Le service technique a pour fonction première l’analyse, la conception, la réalisation et la maintenance des applications de l’entreprise (actuellement nous avons Market-express, Newtech-express, Livraison-express, Coursier-express et Marche-express). Parallèlement à cette fonction première, il est appelé à assister le service marketing et commerciale dans l’exercice de leur fonction. Notamment, la formation sur nos solutions de gestion et application en production. Il arrive couramment que les deux processus métiers cités plus haut font appel au service technique dans le cadre de leur fonction pour que ce dernier puisse leur fournir des outils nécessaires et ou déployer l’environnement technique propice à leur activité.

II.2.2 Système de prise de décision actuel

A MCS on peut distinguer quatre niveaux hiérarchiques : le Directeur, les Ressources humaines, les chefs de service et chef d’équipe et les employés associés aux services. Ici généralement l’ordre ne suit pas le schéma où il doit quitter de la haute direction habilité et chevauché jusqu’au exécutant. Le directeur peut à chaque moment décider du déroulement ou influencer le fonctionnement des activités à chaque niveau. Les projets et objectifs de l’entreprise sont connus de tous. C’est ce qui donne la latitude aux responsables d’entreprendre les décisions relatives à leurs activités et de même pour les exécutants en accord avec le DG et ou le supérieur direct.

II.2.3 Problème

Nous pouvons noter comme problème : d’énorme difficultés de prise de décisions stratégique en temps, fondé sur des données dont la véracité et l’intégrité est mise en doute ; d’énorme difficultés d’exploitation des flux de données issue de l’environnement extérieur qu’intérieur de l’entreprise. Il est à noter que ces différents problèmes influencent fortement le BPM de l’entreprise MCS et est plus accentue sur le processus métier Marketing (les campagnes marketing ne sont pas fondées sur des données concrètes et données des anciennes campagnes ne sont pas exploitées ou avec efficience) et commerciale où le jeu de données est abondant. Où les prises de décisions stratégiques sont généralement fondées sur du bruie et des simples observations de la concurrence et de l’environnement extérieur en général.

[...]

Fin de l'extrait de 129 pages

Résumé des informations

Titre
Intégration d'un système décisionnel d'aide à la prise de décisions aux campagnes marketing et commerciales dans les entreprises de vente en ligne
Sous-titre
Data Warehouse et Business Intelligence
Note
Master II
Auteur
Année
2020
Pages
129
N° de catalogue
V934154
ISBN (ebook)
9783346308801
ISBN (Livre)
9783346308818
Langue
Français
mots-clé
INTEGRATION, SYSTEME, DECISIONNEL, D’AIDE, CAMPAGNES, PRISE DE DECISIONS, DATA, DATA INTEGRATION, BUSINESS INTELLIGENCE, DATA WAREHOUSE, TALEND, POWER BI, ZOHO ANALYTIC, DASHBORD, EMARKETING, DATA ANALYTIC, ETL, ESB, OLAP, OLTP, ROLAP, HOLAP, SYNCHRONISATION, EXTRA DATA, TRANSFORM DATA, LOAD DATA, REPPORTING
Citation du texte
Michel Ruphin Jiofack (Auteur), 2020, Intégration d'un système décisionnel d'aide à la prise de décisions aux campagnes marketing et commerciales dans les entreprises de vente en ligne, Munich, GRIN Verlag, https://www.grin.com/document/934154

Commentaires

  • Pas encore de commentaires.
Lire l'ebook
Titre: Intégration d'un système décisionnel d'aide à la prise de décisions aux campagnes marketing et commerciales dans les entreprises de vente en ligne



Télécharger textes

Votre devoir / mémoire:

- Publication en tant qu'eBook et livre
- Honoraires élevés sur les ventes
- Pour vous complètement gratuit - avec ISBN
- Cela dure que 5 minutes
- Chaque œuvre trouve des lecteurs

Devenir un auteur