La quantité d'informations augmente rapidement dans l'économie actuelle axée sur le client. Les données sont la matière première de la croissance des entreprises. Les résul-tats de l'analyse des données à l'aide des méthodes de data mining représentent un grand potentiel d'information pour les entreprises qui les utilisent.

Le terme a été utilisé pour la première fois dans les années 1960 dans le domaine des statistiques pour la recherche de modèles de données. La méthode qui permet de découvrir de manière indépendante des connaissances dans de grands ensembles de données. À la fin des années 1980, la découverte de connaissances dans les bases de données s'est développée, l'axe de recherche interdisciplinaire qui est aujourd'hui principalement désigné sous le nom de data mining. Dans le domaine de la gestion d'entreprise, ces deux termes sont synonymes. Les premiers prototypes ont été présentés au début des années 1990. Ils intéressaient l'administration des entreprises, en particulier dans le domaine du marketing. "Le data mining vise à extraire des connaissances à partir de données. Au milieu des années 1990, de plus en plus d'entreprises ont commencé à utiliser des outils de data mining."

Leseprobe

Table des matières

1 Introduction

1.1 Définition du problème

1.2 Objectif du travail

2 Méthodes et tâches

2.1 Regroupement

2.2 Association

2.3 Arbres de décision

3 Processus d'exploration de données

4 Conclusion

Objectifs et sujets principaux

L'objectif principal de ce travail est de définir le terme « data mining », d'explorer son origine et son développement historique, tout en clarifiant ses méthodes, ses tâches et son processus d'application typique dans le contexte des entreprises modernes.

Définition et évolution historique du data mining.
Exploration des méthodes de regroupement et d'association.
Utilisation des arbres de décision pour la prédiction comportementale.
Analyse des processus d'exploration de données et de leurs enjeux.
Importance de la gestion des données pour la croissance des entreprises.

Auszug aus dem Buch

2.2 Association

La deuxième méthode est l'association: à l'aide de règles d'association, on peut découvrir des dépendances inconnues dans le comportement des clients. C'est une question classique: Quels sont les clients qui ont acheté le produit A et qui sont susceptibles d'acheter le produit B? J'explique les liens à l'aide de l'exemple des ventes de fruits et légumes.

Nous avons 6 transactions.

Le tableau 1 indique ce qui a été acheté lors des six transactions. Nous voulons maintenant formuler une règle qui dit: si des pommes sont achetées, des poires sont achetées. La qualité d'une règle est déterminée par son degré d'incertitude. Le degré d'incertitude est caractérisé par deux nombres appelés Soutien et Confiance.

Le soutien est le nombre de transactions qui incluent tous les produits de la condition si et de la partie alors. Il est exprimé en pourcentage du nombre total de transactions. Pour notre exemple, le support est égal à 4/6 ou 2/3, c'est-à-dire 66 %. Dans 2/3 des transactions, les pommes et les poires sont achetées ensemble.

La deuxième valeur est appelée confiance dans la règle. Elle est le quotient du nombre de transactions contenues dans la partie Si et Alors et du nombre de transactions de la partie Si. Elle exprime la dépendance, qui se situe entre 0 et 1. La valeur 1 exprime une dépendance obligatoire; les pommes et les poires sont toujours achetées ensemble.

Résumé des chapitres

1 Introduction: Ce chapitre présente le contexte économique actuel axé sur les données et définit les objectifs de l'étude.

2 Méthodes et tâches: Ce chapitre détaille les outils techniques du data mining tels que le regroupement, l'association et les arbres de décision.

3 Processus d'exploration de données: Ce chapitre décrit les étapes typiques de la découverte de modèles et les défis liés à la qualité des données.

4 Conclusion: Ce chapitre synthétise l'importance stratégique de l'analyse des données pour les entreprises gérant de larges volumes d'informations clients.

Mots-clés

Data mining, découverte de connaissances, bases de données, regroupement, association, arbres de décision, segmentation de la clientèle, soutien, confiance, exploration de données, comportement d'achat, analyse statistique, marketing, retour sur investissement, gestion des données.

Foire aux questions

De quoi traite principalement ce travail ?

Ce travail explore le domaine du data mining, son émergence statistique, son évolution technologique et ses applications pratiques dans la gestion moderne des entreprises.

Quels sont les thèmes centraux abordés ?

Les thèmes principaux incluent les méthodes analytiques (regroupement, association, arbres de décision) et le processus logistique visant à extraire des connaissances utiles à partir de données brutes.

Quel est le but principal de l'étude ?

L'objectif est de structurer la compréhension du data mining, de définir ses origines et de présenter les méthodologies clés pour améliorer la prise de décision en entreprise.

Quelle méthode scientifique est utilisée ?

L'étude utilise une approche théorique et descriptive, appuyée par des exemples pratiques de segmentation client et de calcul de probabilités pour valider les règles d'association.

Que couvre la partie principale du texte ?

La partie principale explique concrètement le fonctionnement des méthodes de regroupement, le calcul du soutien et de la confiance dans les règles d'association, ainsi que la construction des arbres de décision.

Quels sont les mots-clés qui caractérisent ce document ?

Les mots-clés incluent data mining, association, clustering, arbres de décision, KDD (Knowledge Discovery in Databases) et gestion de données.

Comment le soutien et la confiance sont-ils calculés ?

Le soutien est le pourcentage de transactions incluant tous les produits d'une règle, tandis que la confiance est le quotient des transactions valides par rapport à la condition initiale.

Quelles limites sont identifiées dans le processus d'exploration ?

L'auteur souligne des risques tels que la sécurité des données sur Internet, les erreurs de saisie manuelle et la présence de valeurs aberrantes pouvant fausser les résultats.

Ende der Leseprobe aus 10 Seiten - nach oben

Details

Titel: Le Data Mining dévoilé. Définition, évolution et processus clés
Autor: Valentina Barysava (Autor:in)
Erscheinungsjahr: 2014
Seiten: 10
Katalognummer: V1380002
ISBN (PDF): 9783346920027
Sprache: Französisch
Schlagworte: data mining définition Data Mining Regroupement Statistiques exploratoires Association Arbres de décision Découverte de données et de connaissances Clustering (regroupement de données)
Produktsicherheit: GRIN Publishing GmbH

Arbeit zitieren: Valentina Barysava (Autor:in), 2014, Le Data Mining dévoilé. Définition, évolution et processus clés, München, GRIN Verlag, https://www.grin.com/document/1380002

Le Data Mining dévoilé. Définition, évolution et processus clés