Travail sur le data mining
Conditions d’achèvement
Les étudiantes doivent travailler avec un jeu de données sur des fleurs comprenant des caractéristiques telles que la longueur et la largeur des pétales et des sépales. Elles doivent utiliser l'algorithme des k plus proches voisins (k-NN) pour classer les fleurs en différentes espèces en se basant sur ces caractéristiques. Avant d'appliquer l'algorithme k-NN, elles doivent effectuer les étapes suivantes :
- Charger et explorer le jeu de données.
- Prétraiter les données en normalisant les valeurs et en divisant le jeu de données en ensembles d'entraînement et de test.
- Appliquer l'algorithme k-NN avec différentes valeurs de k et évaluer les performances du modèle.
Cet exercice teste les objectifs suivants :
- Comprendre les principes fondamentaux du data mining.
- Appliquer des techniques de prétraitement des données.
- Utiliser des algorithmes de classification pour l'analyse de données.
Voici la grille d'évaluation :
Grille d'évaluation :
Critères d'évaluation | Description |
---|---|
Compréhension des principes fondamentaux du data mining | L'étudiante démontre une compréhension claire des concepts de base du data mining, y compris la classification et l'algorithme k-NN. |
Application des techniques de prétraitement des données | L'étudiante prétraite correctement les données en normalisant les valeurs et en divisant le jeu de données en ensembles d'entraînement et de test. |
Utilisation efficace de l'algorithme de classification | L'étudiante applique correctement l'algorithme k-NN pour classer les fleurs en différentes espèces en se basant sur les caractéristiques données. |
Choix approprié des paramètres | L'étudiante expérimente avec différentes valeurs de k et choisit judicieusement celle qui donne les meilleures performances du modèle. |
Interprétation des résultats | L'étudiante évalue et interprète correctement les performances du modèle k-NN et tire des conclusions appropriées sur la classification des fleurs. |