: :   data quality     : :   data morphing     : :   data mining     : :   arbres de décision

 

 

 


 

LES ARBRES DE DECISION

Le but du Data Mining est de trouver la réponse à une question portant sur des données que vous avez recueillies. Cette question doit être définie dans un champ à expliquer. La question sera de la forme: "quelles entrées, dans ma base de données, ont une certaine valeur pour le champ à expliquer?

Ensuite, avec l'outil de Data Mining, vous découvrez quels critères ont un impact significatif sur le champ à expliquer, ce qui signifie que vous pouvez éclater la population totale en sous-populations se comportant différemment l'une de l'autre selon le champ à expliquer.

Les arbres de décision sont les outils les plus rapides et les plus faciles pour le Data Mining .
Prenons l'exemple d'une banque. Sa base de données contient des informations au sujet des prêts clients à court-terme.
L'âge, les salaires, l'ancienneté, le nombre d'enfants, etc... sont autant d'informations présentes dans la base de données.
Un champ de la base de données, appelé 'Succès', indique si le client a eu des problèmes pour rembourser le prêt.
Après avoir importé ces données dans Alice d'ISoft, le responsable crédit construit un arbre.

 

 

 



Noeud Parent                       Noeuds Enfants


Un arbre se compose de noeuds.
Le noeud gauche est la racine de l'arbre.
Les noeuds droits sont les feuilles.
Chaque noeud, excepté la racine possède un noeud parent qui est lié à ses fils.
Chaque noeud contient un sous-ensemble de la population initiale. La racine contient la population entière.

Les noeuds peuvent afficher de nombreuses informations: le nombre de clients, le nombre et le pourcentage de clients qui ont eu des problèmes pour rembourser leurs prêts (valeur N), le nombre et le pourcentage de clients qui n'ont pas eu de problème pour rembourser leurs prêts (valeur Y), la représentation graphique des valeurs Y et N...etc...

 

Retour ACCUEIL Retour ACCUEIL