Data Mining

Fiabilité

Qu’est-ce que le Data Mining ?

Le data mining est le processus d’analyse des modèles cachés de données selon différentes perspectives afin de transformer ces données en informations utiles et souvent exploitables. Les données sont collectées et rassemblées dans des zones communes, telles que les entrepôts de données, et les algorithmes de data mining recherchent des modèles que les entreprises peuvent utiliser pour prendre de meilleures décisions, par exemple des décisions qui permettent de réduire les coûts, d’augmenter les revenus ou de mieux servir les clients.

Le data mining est également connu sous le nom de data discovery (découverte de données) ou knowledge discovery (découverte de connaissances). Il est essentiel à l’intelligence économique pour prendre des décisions fondées sur des données.

Techopedia explique le Data Mining

Les principales étapes d’un processus d’exploration de données sont les suivantes :

  • Extraire, transformer et charger les données dans un entrepôt de données
  • Stocker et gérer les données dans une base de données multidimensionnelle
  • Fournir un accès aux données aux analystes commerciaux à l’aide d’un logiciel d’application
  • Présenter les données analysées sous des formes facilement compréhensibles, telles que des graphiques.

La première étape de l’exploration de données consiste à rassembler les données pertinentes essentielles à l’activité de l’entreprise. Les données de l’entreprise sont soit transactionnelles, soit non opérationnelles, soit des métadonnées. Les données transactionnelles concernent les opérations quotidiennes telles que les ventes, les stocks et les coûts. Les données non opérationnelles sont normalement des prévisions, tandis que les métadonnées concernent la conception logique des bases de données. Les schémas et les relations entre les éléments de données peuvent souvent fournir des informations pertinentes pour améliorer les processus opérationnels. Les organisations fortement axées sur les consommateurs ont recours à des techniques d’exploration de données qui leur permettent d’obtenir une image claire des produits vendus, des prix, de la concurrence et des caractéristiques démographiques des clients.

Par exemple, le géant du commerce de détail Walmart transmet toutes ses informations pertinentes à un entrepôt de données contenant des téraoctets de données. Ces données sont facilement accessibles aux fournisseurs, ce qui leur permet d’identifier les habitudes d’achat des clients. Ils peuvent générer des modèles sur les habitudes d’achat, les jours où les achats sont les plus fréquents, les produits les plus recherchés et d’autres informations en utilisant des techniques d’exploration de données.

La deuxième étape de l’exploration de données consiste à sélectionner un algorithme approprié – un mécanisme produisant un modèle d’exploration de données. Le fonctionnement général de l’algorithme consiste à identifier les tendances dans un ensemble de données et à utiliser les résultats pour la définition des paramètres. Les algorithmes les plus utilisés pour l’exploration de données sont les algorithmes de classification et les algorithmes de régression, qui servent à identifier les relations entre les éléments de données. Les principaux fournisseurs de bases de données, comme Oracle et SQL, intègrent des algorithmes d’exploration de données, tels que le regroupement et les arbres de régression, afin de répondre à la demande d’exploration de données.

Termes connexes

Margaret Rouse
Technology Specialist
Margaret Rouse
Experte en technologie

Margaret Rouse est une écrivaine technique primée et enseignante reconnue pour sa capacité à expliquer des sujets techniques complexes à un public non technique et commercial. Au cours des vingt dernières années, ses explications ont été publiées sur les sites Web de TechTarget et elle a été citée comme une autorité dans des articles du New York Times, du Time Magazine, de USA Today, de ZDNet, de PC Magazine et de Discovery Magazine. L'idée que Margaret se fait d'une journée amusante est d'aider les professionnels de l'informatique et des affaires à apprendre à parler leurs langages hautement spécialisés respectifs. Si…