Nous avons décider de réaliser le premier projet de codage qui consiste à implémenter l’algorithme de clus- tering K-means. Le clustering est un algorithme de d’apprentissage non-supervisée, cela signifie que les données qu’il reçoit ne sont pas étiquetée, il ne connaît pas l’origine des données, mais lors des phases d’apprentissage, il va découvrir des patternes et des caractéristiques communes entre les données et se basé sur es informations pour réaliser ses prédictions. L’algorithme K-means est l’algorithme de clustering le plus populaire et permet de divise les données en K groupes en minimisant la distance entre les points de données et le centre de leur cluster. L’objectif de ce projet est d’implémenter l’algorithme de clustering k-means et certaines de ses variations comme k-means++ et la version mini-batch, le tout en faisant varier la dimensionnalité et la distribution des points.
Liens vers notre rapport : Rapport de projet
-
Clément GHYS
- GitHub: Clément GHYS
-
Benjamin MILHET
- GitHub: Benjamin MILHET