Accueil » Data mining : les méthodes de data mining et l’exploration des données

Data mining : les méthodes de data mining et l’exploration des données

Qu’est-ce que le data mining ?

Data mining : il ne suffit pas de stocker de grandes quantités de données dans une base de données dédiée, un entrepôt de données ou du big data. Il est toujours nécessaire de les utiliser. C’est le rôle du datamining : s’il est utilisé correctement, il pourra apprendre des cours contenus dans d’énormes quantités de données. Ces données sont trop volumineuses pour être satisfaites par les seuls outils statistiques.

En fait, l’exploration de données est un terme général qui englobe toute la série d’outils permettant d’explorer et d’analyser les données contenues dans les référentiels décisionnels (tels que l’entrepôt de données ou DataMart).

Les techniques mises en pratique lors de l’utilisation de cet instrument d’analyse et de prospection sont particulièrement efficaces pour extraire des informations significatives à partir de grandes quantités de données.

Quelles sont les 4 principales tâches de data mining ?

Quelles sont les 4 principales tâches de data mining
Quelles sont les 4 principales tâches de data mining

Nous pouvons retrouver six principes de tâche du data mining :

  • description
  • estimation
  • prédiction
  • classification
  • clustering
  • association

La description

Parfois, les chercheurs et les analystes essaient simplement de trouver des moyens de décrire les tendances cachées des données. Des descriptions de modèles et de tendances sont utilisées pour expliquer ou vérifier les faits. Par exemple : La personne ayant le plus haut degré est la plus susceptible d’occuper le poste.

L’estimation

Utilisez les données pour créer un modèle qui fournit la valeur de la variable cible ainsi que le « prédicteur ».

Exemple : estimation de la pression artérielle des patients hospitalisés en fonction de l’âge, du sexe, de l’indice de masse corporelle et du taux de sodium. La relation entre la pression artérielle et les variables prédictives de l’ensemble d’apprentissage nous fournira un modèle d’estimation.

La prédiction

La prédiction est similaire à la classification et à l’estimation, sauf que le résultat de la prédiction se situe dans le futur. Un exemple de tâche de prévision appliquée au marketing : prédire le cours de l’action pour les trois prochains mois.

La classification

Supposons que le décideur souhaite classer les employés par niveau de revenu ou par toute autre caractéristique liée à la personne (comme l’âge, le sexe et la profession). Cette tâche est une tâche de classification.

Le clustering

Le regroupement fait référence à la classification des données, des observations ou des cas en objets similaires. Le clustering maximise la similitude des objets du même cluster et minimise la similitude des objets de différents clusters. En fait, il n’y a pas de variable cible pour le clustering. La tâche de clustering n’essaie pas de classer, d’estimer ou de prédire la valeur de la variable cible. Utilisez plutôt la métrique de distance pour diviser toutes les données en sous-groupes relativement homogènes.

L’association

La recherche de règles d’association est la tâche la plus intéressante de l’exploration de données. C’est aussi le plus répandu dans le monde des affaires, notamment en marketing pour l’analyse de marché. La recherche de règles d’association vise à trouver des règles quantitatives ou d’association entre deux ou plusieurs attributs. Le format de la règle d’association est « Si elle apparaît en premier, ce sera le résultat », avec la confiance associée à la règle. La recherche de règles d’association dans une grande base de données révélera des règles cachées utiles pour la prise de décision.

Un exemple de règle célèbre : lorsqu’un homme achète une couche pour bébé, il achète 2 paquets de bière 65 % du temps. Il sera intéressant pour le manager d’adapter sa promotion à ces nouvelles règles.

Quelles sont les différentes formes de représentation des données d’un projet de data mining ?

Quelles sont les différentes formes de représentation des données d'un projet de data mining
Quelles sont les différentes formes de représentation des données d’un projet de data mining

 

Data mining : En plus de ce qui peut maintenant être décrit comme l’exploration de données classique (comme décrit ci-dessus), l’expertise technique dans l’exploration de données comprend également l’exploration d’images, l’exploration de données Web, l’exploration de flux de données et l’exploration de texte.

Pourquoi faire du data mining ?

Aujourd’hui, l’exploration de données a été utilisée dans de nombreuses activités, tels que la recherche, le marketing, le développement de produits, la santé, et même l’éducation. Ce processus peut résoudre rapidement des problèmes qui prenaient auparavant beaucoup de temps à résoudre manuellement.

Quels sont les types d’algorithmes en data mining ?

Le logiciel d’exploration de données analyse les relations et les modèles des données de transaction stockées en fonction des demandes des utilisateurs. Plusieurs types de logiciels d’analyse peuvent être utilisés : statistiques, apprentissage automatique et réseaux de neurones.

Quels sont parmi ces termes les facteurs de succès du data mining ?

Plusieurs facteurs rentrent en ligne de compte dans la réussite d’un projet Data mining. Cependant, le facteur de succès principal est la personnalisation des rapports vendeurs/clients, autrement dit la gestion de la relation client par des moyens statistiques et chiffrés.

Comment Peut-on exploiter des données ?

Data mining : La collecte de données peut être effectuée manuellement ou à l’aide d’un logiciel tel que Flint. La collecte manuelle des données est aussi simple que de demander une adresse e-mail au moment de l’achat. Vous pouvez comparer les achats liés aux adresses e-mail et savoir exactement comment cibler ce client.

 

Objectif et stratégie d’entreprise expliqué sur ce guide !

AdminBlogueur

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Revenir en haut de page